Spatio-temporal Moran Scatter Plot and its Application in Identifying Drought Spatio-temporal Aggregation Areas in China

  • WANG Zheng , 1, 2, 3 ,
  • CHENG Changxiu , 1, 2, 3, * ,
  • LI Chang 4
  • 1. State Key Laboratory of Earth Surface Processes and Resource Ecology, Beijing Normal University, Beijing 100875, China
  • 2. Key Laboratory of Environmental Change and Natural Disaster, Beijing Normal University, Beijing 100875, China
  • 3. Faculty of Geographical Science, Beijing Normal University, Beijing 100875, China
  • 4. Department of Geography, University of Wisconsin-Madison, Madison 53706-1404, United States
* CHENG Changxiu, E-mail:

Received date: 2021-10-15

  Revised date: 2021-12-27

  Online published: 2022-09-25

Supported by

National Key Research and Development Program in China(2019YFA0606901)


Drought, as one of the most difficult natural disasters to identify, causes the most serious economic losses in the entire natural disaster system. Drought in spatio-temporal aggregation areas deserves more attention than its changes and patterns because it usually causes greater damages. SaTScan provides a method for identifying spatio-temporal aggregation areas of disaster. However, there are also some defects, such as difficulty in parameter setting and inefficiency in boundary identification. For instance, the maximum scanning window in SaTScan needs to take many attempts to get a fine result. Moran scatter plot provides a method for the identification of spatio aggregation areas, which could solve problems that SaTScan faces above, but it could only identify aggregation areas in space. In this study, we proposed a method named Spatio-temporal Moran Scatter Plot based on Moran scatter plot and Local Indicators of Association (LISA), which could select scatters according to the threshold of concerned phenomenon and the LISA confidence level required by the researcher. This method plotted scatters in spatio-temporal coordinate system to get the spatio-temporal aggregation areas. This study took droughts in China from 2009—2014 as an example to identify the spatio-temporal aggregation areas, the results showed that:(1) Spatio-temporal drought aggregation areas identified by the proposed method were almost consistent with the truth, which demonstrated the effectiveness of the method. Besides, compared with the spatio-temporal scanning method, the method proposed in this study was not only easier in parameters setting but also clearer and more accurate in boundary identification; (2) The large-scale, strong drought spatio-temporal aggregation areas occurred in 2009 and 2011. In 2009, the main aggregation areas concentrated in Shanxi, Shaanxi, Beijing-Tianjin-Hebei, eastern Tibet, northeastern Inner Mongolia, Liaoning, Jilin, and Yunnan-Guizhou-Sichuan area; in 2011, the main aggregation areas concentrated in Huanghuai area, the middle and lower reaches of the Yangtze River, and Yunnan-Guizhou-Sichuan area. The local-scale, strong drought spatio-temporal aggregation areas occurred in 2010 and 2014. In 2010, the main aggregation areas concentrated in Yunnan-Guizhou-Sichuan area; in 2014, the main aggregation areas concentrated in Eastern Inner Mongolia, Liaoning, and other areas in Northeast China. The slight drought spatio-temporal aggregation areas occurred in 2012 and 2013. In 2013, some mild drought clusters occurred in western Inner Mongolia, southern Gansu, Ningxia, southern Shaanxi, and northern Henan. In general, the spatio-temporal drought aggregation areas concentrated mainly in Yunnan-Guizhou-Sichuan, Northeast China, Huanghuai Region, and the middle and lower reaches of the Yangtze River.

WANG Zheng , CHENG Changxiu , LI Chang . Spatio-temporal Moran Scatter Plot and its Application in Identifying Drought Spatio-temporal Aggregation Areas in China[J]. Journal of Geo-information Science, 2022 , 24(7) : 1301 -1311 . DOI: 10.12082/dqxxkx.2022.210633

1 引言

中国是世界上受旱灾影响最严重的国家之一,据统计,气象灾害损失占中国全部自然灾害损失的61%,其中旱灾占比又高达其中的55%[1]。基于气象观测或再分析等数据开展地理现象(干旱)时空格局与演变研究是地理领域的热点之一[2-3]。过去几十年,干旱时空格局及演变研究取得了显著成果。高燕俐等利用不同时间尺度的标准化降水指数(Standardized Precipitation Index, SPI)和标准化降水蒸散指数(Standardized Precipitation Evaporation Index, SPEI)对广西壮族自治区干旱空间格局进行识别,并利用折线图对时间趋势进行分析[4],Gao等[5]利用SPEI对黄土高原干旱时空趋势进行识别,采用空间快照叠加时间趋势的方式表示其时空演变,Kai等[6]利用3个月尺度的SPI和SPEI对1961—2012年的干旱事件进行时空识别,并对其干旱轨迹进行研究。
上述研究多采用时空快照识别干旱时空格局,即先建立若干时间段内干旱格局的空间快照、再人工解译空间格局与时间过程;然而,面对长时间序列的数据,该方法通常需要做时段的划分,如何划分时段时是需要回答的问题,此外某时段综合的结果难以还原该时段内精细的时间过程、也难以科学刻画精细的空间边界。如何精细、准确地给出时空聚集区边界并辅以相应的不确定性描述,是时空统计学的重要科学问题之一,即时空聚集区识别问题。目前,时空统计学中较为成熟的方法是时空扫描统计法,即利用不同大小的圆柱体在时空数据中进行扫描,找出显著聚集的若干圆柱作为时空聚集区。该方法已被Kulldorff M等[7]在SaTScan软件中实现,并广泛应用于时空聚集区的识别中[8]。文献[9]—[11]分别对杭州市流感病例、抚州市肺结核、温州市的新型冠状病毒肺炎的时空聚集性进行识别。文献[12]利用时空扫描模型和局部空间自相关模型对中国区域的极端降水时空聚集区进行识别,该模型原理与SaTScan类似。
尽管时空扫描方法已得到广泛应用,但是该方法仍然存在2个问题:① 该方法扫描出的时空聚集区通常为圆柱体,但在时空聚集区不规则的情况下SaTScan难以给出精确的边界;② 最大扫描窗口等参数的设定往往需要多次尝试,才能取得较好的效果。当然,不少学者也尝试对该方法进行改进;如张婷等[13]利用SaTScan结合Moran散点图识别了2013年7月极端高温的时空聚集区;万幼等[14]提出一种不规则形状的时空异常聚类模式挖掘方法stAntScan,可以较为准确地获取聚类区形状。虽然这些方法可以获得相对精准的时空聚集区边界,但依然存在原理、参数复杂等问题。
Moran散点图作为常用的空间聚集区识别方法,具有计算简单、范围精确的优点;但它只能进行空间聚集区的识别[15-17],无法直接应用于时空聚集区。论文通过对Moran散点图进行时空扩展,得到时空Moran散点图,而后辅以时空扩展后的局部空间关联指标(Local Indicators Spatial Association, LISA)进行显著性检验,创新地提出一种时空聚集区识别方法,并以2009—2014年中国干旱时空聚集区的识别为例,对该方法进行了验证。

2 数据来源与研究方法

2.1 数据来源及处理

2.1.1 NSPEI数据及其处理

考虑到气象数据的非平稳性[18-20],论文选用温庆志等[21]计算的3个月尺度的非平稳标准化降水蒸散指数(Non-stationary Standardized Precipitation Evaporation Index, NSPEI)进行干旱的时空聚集性识别。温志庆等[21]已证实NSPEI对中国区域的干旱指示作用优于SPEI;同时,已有研究表明:代表季节尺度的3个月的干旱指数在中国各区域的适用性较好[22]

2.1.2 验证数据

表1 验证数据集

Tab. 1 Validation dataset

编号 新闻来源 报导时间 发生地点 发生时间 干旱强度描述
T_1 中国新闻网 2009年12月17日 山东省全境,河南、河北、山西、陕西等省大部,甘肃省东部和南部及苏北、皖北等冬小麦主产区 2008年11月
T_2 中国新闻网 2009年12月17日 西藏东部 2009年4—6月
T_3 中国天气网 2009年5月30日 黑龙江和内蒙古东北部 2009年5月 黑龙江大部分地区降雨为1951年以来最少,气温为1951年以来最高,粮食产区受旱面积大
T_4 中国新闻网 2009年12月17日 辽宁、吉林、内蒙古东部 2009年6月下旬
T_5 中国新闻网 2009年12月17日 湖南、江西、贵州、云南、广西、广东 2009年8月
T_6 中国新闻网 2009年12月17日 云南、贵州、四川等地 2009年11月
T_7 中国新闻网 2009年12月17日 全国 2009年 干旱发生的频次高、范围广
T_8 中国天气网 2010年11月24日 云南、贵州、四川南部、广西北部 2009年11月—2010年3月中旬 农业生产受灾严重、江河湖库水位明显下降、人畜饮水困难
T_9 新华网 2011年5月24日 长江中下游地区 2011年1月1日
T_10 中国新闻网 2011年2月24日 山东省全境,河南、河北、山西、陕西等省大部,甘肃省东部和南部及苏北、皖北等冬小麦主产区 截至2011年
T_11 中国天气网 云南、贵州、四川等省份 2011年6—9月 多地最高气温以及连续高温日数都破记录,居民的生活和生产受到严重影响
T_12 中国科技网 2012年12月28日 云南 2012年初—
T_13 新华网 2014年1月13日 西南、西北 2013年冬、春季 冬春旱
T_14 新华网 2014年1月13日 华北、黄淮 2013年秋季 秋旱
T_15 新华网 2014年1月13日 全国 2013年 全国旱情总体偏轻
T_16 内蒙古新闻 2014年7月28日 内蒙古 2014年4月初—
T_17 北京晨报 2014年8月14日 辽宁 2014年7月—
T_18 中国新闻网 2014年12月25日 北方 2014年 灾害总体偏轻但局部较重,辽宁、河南、内蒙古受灾较重
T_19 新华网 2012年4月14日 黑龙江 2011年8月—
T_20 中国气象局新闻发布会 2013年11月1日 江南、河南、陕西等 2013年9月底

2.2 时空Moran散点图、时空LISA及其显著性 检验

2.2.1 方法流程

图1 研究方法流程

Fig. 1 Flowchart of study method

2.2.2 时空Moran散点图

图2 Moran散点图的时空扩展过程

Fig. 2 Spatio-temporal extend process of Moran scatter plot

z i = x i - x _ δ
W z = j w i j x j - x _ δ
式中: x i为对应单元i的观测值; x ji的邻域单元j的观测值; x _为样本的均值; δ为样本的标准差; w i j为时空权重矩阵。

2.2.3 时空LISA及其显著性检验

同样,本文对LISA进行时空扩展,将LISA和显著性计算中的n×n空间邻域变为n×n×n的时空邻域。对于任意时空单元i,其时空LISA值 I i的计算方法见式(3)。
I i = x i - x _ δ 2 j w i j ( x j - x _ )
z i = I i - E ( I i ) V a r ( I i )
式中: E ( I i )为样本的期望; V a r ( I i )为样本的方差。

3 中国干旱时空聚集区识别流程及 结果分析

3.1 干旱时空聚集区的识别流程

3.1.1 NSPEI的时空Moran散点图及其显著性检验

图3 不同显著性下时空Moran散点图

Fig. 3 Spatio-temporal Moran scatter plot in different significance


3.1.2 属性阈值的确定及时空聚集区的提取

后续仅关注中度(-1≥NSPEI>-1.5)、重度 (-1.5≥NSPEI>1.99)、极端干旱(-2≥NSPEI)3种情况,即NSPEI小于等于-1的情况。根据式(1)可计算出上述三种情况对应的横、纵坐标值都小于-1.41的点;这些点在时空坐标系中对应的区域即为时空聚集区。从图3(d)中筛选出横纵坐标均小于-1.41的点,并用彩色渲染,如图4左图所示。其中,青色点为2011年干旱聚集区对应的散点。将青色点对应到时空坐标系后,如图4右图所示,指数越大,代表干旱的聚集性越强。而当干旱类型确定后,LISA也可以表征干旱的严重程度。
图4 经过阈值筛选的时空Moran散点图及其对应的干旱聚集区(2011年,p<0.001)


Fig. 4 The filtered spatial-temporal Moran scatter plot and its corresponding drought aggregation areas(2011, p<0.001)

3.2 2009—2014年中国干旱时空聚集区识别结果

图5 2009—2014年干旱时空聚集区分布(p<0.001)


Fig. 5 Distribution of drought spatio-temporal aggregation areas(p<0.001)

表2 14个典型的干旱时空聚集区

Tab. 2 Fourteen typical drought spatio-temporal aggregation areas

编号 发生时间 持续时间/月 发生地点 严重程度
R_1 2009年1—2月 2 山西、陕西、京津冀一带
R_2 2009年4—6月 2 西藏东部 一般
R_3 2009年5月 1 内蒙古东北部
R_4 2009年6—11月 6 内蒙古东部、辽宁、吉林
R_5 2009年11—2010年4月 6 云、贵、川地区
R_6 2011年1—5月 5 长江中下游地区
R_7 2011年1—4月 4 以山东、河南为中心的黄淮地区
R_8 2011年7—10月 4 云、贵、川地区
R_9 2011年8—2012年2月 6 黑龙江
R_10 2013年3—4月 2 内蒙古西部、甘肃南部、宁夏 一般
R_11 2013年9—2013年11月 3 陕西南部和河南北部 一般
R_12 2014年2—2014年5月 4 内蒙古和东北地区
R_13 2014年8—9月 2 辽宁和内蒙古东部
R_14 2014年10—2014年11月 2 辽宁南部

3.3 结果验证

表3 2009—2014年相关干旱报道与聚集区时空符合程度

Tab. 3 Spatio-temporal correlation between drought reports in 2009—2014 and aggregation areas

验证数据编号 对应的结果编号 空间符合程度 时间符合程度
T_1 R_1 完全一致 完全一致
T_2 R_2 完全一致 完全一致
T_3 R_3 一半符合 完全一致
T_4 R_4 完全一致 完全一致
T_5 R_5 完全一致 完全一致
T_6 R_5 少许偏差 完全一致
T_7 R_1、R_2、R_3、R_4、R_5 完全一致 完全一致
T_8 R_5 少许偏差 完全一致
T_9 R_6 完全一致 完全一致
T_10 R_7 完全一致 完全一致
T_11 R_8 完全一致 少许偏差
T_12 不符合 不符合
T_13 R_10 完全一致 完全一致
T_14 R_11 完全一致 少许偏差
T_15 R_10、R_11 完全一致 完全一致
T_16 不符合 不符合
T_17 R_13 完全一致 完全一致
T_18 R_12、R_13、R_14 完全一致 完全一致
T_19 R_9 完全一致 完全一致
T_20 R_11 少许偏差 完全一致



3.4 论文提出的方法与SaTScan的对比及分析

为了更清楚地对比时空Moran散点图与SaTScan的区别,以2009年12月为例,分别使用2种方法对干旱聚集区进行识别,结果如图6所示。根据图6可知,SaTScan识别的结果为圆形;而论文所述方法识别的结果边界较为细致,且可以细致地展示聚集区内干旱的严重程度。此外,从识别的准确性来看,SaTScan识别出云贵川、西藏南部和河北东部3个聚集区,且云贵川的相对危险度(Relative Risk, RR)较高,聚集程度较高;而论文方法识别的时空聚集区主要分布在云贵川以及西藏中南部地区,其中云南中东部较为严重,未识别出河北东部的聚集区。查阅相关文献和新闻,并未发现有12月份河北东部出现旱情的报告。这可能是后者未考虑时间关联性导致的。综合来看,SaTScan识别的结果较为粗糙,不能细致展示干旱聚集区的位置及严重程度。
图6 时空Moran 散点图法与SaTScan法的干旱时空聚集区比较(以2009年12月为例)


Fig. 6 Comparison of drought spatio-temporal aggregation areas between method of SaTScan and spatio-temporal Moran scatter plot (Take December 2009 as an example)

4 结论与展望

