Orginal Article

Data Mining and GIS Modeling of Urban Spatial Distribution Characteristics Based on Voronoi Diagram: Taking Shanxi Province as an Example

  • LIN Hui ,
  • ZHENG Xinqi , *
Expand
  • School Information Engineering, China University of Geosciences, Beijing 100083, China
*Corresponding author: ZHENG Xinqi, E-mail:

Received date: 2013-10-21

  Request revised date: 2013-12-11

  Online published: 2015-01-05

Copyright

《地球信息科学学报》编辑部 所有

Abstract

Strengthening urbanization has now become the main task of China’s modernization. Urban spatial distribution patterns are characterized by complexity and diversity. Through these characteristics, it is easy to notice problems such as the uneven distributions of urban areas within provinces, the excessive implemented levels in administrative divisions, and huge gaps existed between cities and towns in terms of their urbanization levels. Therefore, it is important to find out how to display the spatial distribution of urban area rationally and explore useful information. As one of the spatial data mining tools, Voronoi diagram can be used to implement spatial subdivision and reveal the scope of spatial influence generated by urban area. In this article, a Voronoi diagram of Shanxi Province, which is weighted by the city centricity intensity, is generated using the Weighted Voronoi Diagram Extension for ArcGIS 9.x. It is also used to analyze the spatial influence of cities in Shanxi and to evaluate the rationalities and limitations in developing these cities. Undeveloped areas in these cities are obtained by combining Voronoi diagram with Delaunay triangulation and overlay analysis. Counties to be developed are obtained by implementing overlay analysis on county, street, and river data. Finally, the rationality and feasibility are evaluated by integrating general Voronoi diagram with Cv values. Through the analysis, conclusions could be made as follows: Taiyuan city has a larger spatial influence area than the other cities, and it has a negative impact on the development of other cities; western and eastern areas in Shanxi are developed unevenly; the cities of Fanzhi, Lingshi, and Xinjiang have the advantages and potentials to be developed in priority. Through the integration of general Voronoi Diagram and Cv values, the results correspond well to the actual situations.

Cite this article

LIN Hui , ZHENG Xinqi . Data Mining and GIS Modeling of Urban Spatial Distribution Characteristics Based on Voronoi Diagram: Taking Shanxi Province as an Example[J]. Journal of Geo-information Science, 2015 , 17(1) : 62 -68 . DOI: 10.3724/SP.J.1047.2015.00062

1 引言

目前,对于城镇空间分布特征的研究大多数是选择道路、高程、坡度、经济发展等驱动因子建立缓冲区,或是从城乡居民点的角度出发,以常规Voronoi图,得到居民点拓扑指数,通过计算变异系数Cv值得到用地类型[1-3]。依据叶大年院士提出的城市对称分布理论[4],山西省城市呈格子状分布,以太原为中心成靶形分布。这些研究从不同侧面探讨了区域城镇的发展特征。但是,从之前的研究方法中可以发现一些城镇的特征,比如叶大年主要通过手工方式从地图上进行两侧和目视识别。如何借助GIS的空间分析功能发现和验证城镇分布特征以及为城镇优化发展提供决策参考,是值得深入研究的问题。
Voronoi图(包括加权Voronoi图)直观地呈现空间点分布的特征,适用于城镇行政中心的空间分布影响范围识别,以及城市发展不均衡的“空洞”挖掘,为待优先发展城镇提出建议等。
本研究以山西省地级市行政中心为分析对象,创建常规Voronoi图、Delaunay图、加权Voronoi图,分析对比常规Voronoi图与加权Voronoi图的区别,得到山西省地级市空间影响范围;在建立Delaunay图的基础上,以地级市平均距离为半径建立缓冲区,分析河流、道路、人口、产业经济等实际情况,得到待优先发展城镇。

2 研究区地理背景与数据

山西地处中国中部,黄河中游,太行山之西(简称晋)。山西总人口3355.21万人,其中,城市人口1412.81万人。11个地级市分别为太原市、大同市、朔州市、忻州市、阳泉市、晋中市、吕梁市、长治市、晋城市、临汾市、运城市,县(市、区)119个。
山西省与邻省19个地级市相邻,经济发展受周边区域影响较大。为分析山西省地级市影响范围,本文搜集了山西省周边19个地级市的常住人口、城镇人口、生产总值(GDP)、第一产业产量、第三产业产量、通车里程等数据(数据来自山西省统计信息网和中国经济社会发展统计数据库)参与计算,从更大范围辅助对研究区城镇空间分布特征的挖掘。
研究中采集的矢量数据主要有山西省区域、山西省界线、地级市界线、地级市行政中心、县界线、县行政中心、山西省主要河流(1-5级)、山西省主要道路、主要铁路等。

3 山西省城镇空间分布特征的Voronoi图建模

3.1 Voronoi图原理与方法

Voronoi图的定义[5-6]是对于平面上n个离散点而言的,它把平面分成几个区,每个区包括一个点,该点所在的区是到该点距离最近点的集合。通常一个点目标的Voronoi区域可以定义为由距该点目标比所有其他目标距离近的目标构成:
p i v = x | d ( x , p i ) d ( x , p j ) , p i , p j P , i j (1)
式(1)中, p i v 为目标点 p i 的Voronoi区域;P为点目标集合;x为空间中任一点;d为距离函数。
加权Voronoi图定义[7]的距离是权重距离:
d w p , p i = 1 w i 1 d p , p i - w i 2 (2)
式(2)中,wi1大于0,wi1wi2是加权Voronoi图的权重。当wi2=0时产生倍增的加权Voronoi图(Multiplicatively Weighted Voronoi Diagram),是在发生点集的扩散速度与权重成比例情况下形成的;当wi1=1时产生相加的加权Voronoi图(Additively Weighted Voronoi Diagram);当 w i 1 1 w i 2 2 时产生复合的加权Voronoi图(Compoundly Weighted Voronoi Diagram)。
加权Voronoi图定义可表示为:
V w p i = i = 1 n { p | d w p , p i d w p , p j } , i j (3)
式(2)、(3)表明权重越大,Voronoi多边形的面积越大。
加权Voronoi图与常规Voronoi图的区别是其距离为加权后的距离,性质基本相同。
(1)中心性强度
基于城市中心性[8]的基本含义,中心城市借助各种物质流,通过其强大的经济实力对周围区域进行有效的辐射带动。对此,应该更多地考虑区域之间的联系、中心城市的经济实力和中心城市能为周围区域提供服务的能力等。鉴此,分别选取城市的非农业人口(反映城市化发展现状及中心城市与周围区域的联系强度)、国内生产总值(反映研究城市的经济实力)和城市流强度(反映研究个体和周围区域之间的相互联系)、城市之间的经济距离(反映中心城市与其他城市之间经济联系的阻力情况)4个指标组成指标体系,度量城市中心性强度,公式为:
Q i = G i 1 n i = 1 n G i + Y i 1 n i = 1 n Y i + N i 1 n i = 1 n N i × j = 1 n 1 D i - j (4)
式(4)中,Qi表示i地级市的区域性中心强度;Gi表示i地级市的城市经济总量(由地区生产总值剔除第一生产总值得到); Y i 表示i地级市第三产业总产值; N i 表示i地级市非农业人口总量; D i - j 表示i地级市到j地级市的经济距离;ij表示地级市的数目。
区位因子公式为:
P j = j = 1 n 1 D i - j (5)
式(5)中, D i - j 为经济距离,计算方法是用两地间的交通里程乘以修正权数 α β α 为通勤距离修正权数,其取值由城市间的交通运输状况决定。 β 为经济落差修正权数,其取值由山西省各地级市之间人均GDP比值决定(即周边地级市与省内地级市人均GDP之比):当比值小于0.45时,取 β = 1.2 ;当比值介于0.45与0.7之间时,取 β = 1 ;当比值不小于0.7时,取 β = 0.8
(2)配位数(Coordination Number)
配位数是指一个地理学的行政单位(省、市、县、乡和村)周边相邻的同级行政单位的数目。在理想层面上,城市(集镇)的配位数等于6,但在实际情况下,城市(集镇)的配位数是变化的,而配位数的平均值却固定不变,仍然等于6,称之为配位数定律。
配位数在Voronoi图中即是Voronoi多边形的边数。
依据配位数定律,在添加待发展县城之后,Voronoi图的平均配位数依然需要接近6。
(3) C v
应用计算几何学中Voronoi图的变异系数 C v 值可以衡量现象在空间上的相对变化程度。当某个点集的空间分布为均匀分布时,其Voronoi多边形面积的可变性小, C v 值低;当空间分布为集群分布时,在集群内(“类”内)的Voronoi多边形面积较小,而在集群间(“类”间)的Voronoi多边形面积较大, C v 值高。
C v = 标准差 平均值 × 100 % (6)
Duyckaerts提出了3个建议值[9]:当 C v 值为33%~64%时,点集为随机分布;当 C v 值为大于64%时,点集为集群分布;当 C v 值为小于33%时,点集为均匀分布。
本文以城市变化前后的空间分布作对比,如果城市的分布更为集中,验证的结果是新分布效果良好。

3.2 基于Voronoi图的GIS分析

以Voronoi图为基础,以图1的流程进行分析,具体步骤如下:
Fig. 1 Flowchart of analyzing steps

图1 分析流程图

(1)山西省矢量数据的预处理。
(2)山西省地级市中心性强度预处理,利用山西省地级市人口、生产总值、经济距离、城市流强度4个指标进行计算。由于山西省各个地级市之间均有铁道和公路连接,交通便捷,参考已有研究成果,将通勤距离修正权数 α 均取0.7。由于两地级市之间的交通里程数据没有来源,考虑到地级市的通车里程在一定程度上反映了该城市的交通发达情况,本文以地级市的通车里程代替两地级市之间的交通里程,计算结果如表1所示。
Tab. 1 Centricity intensity level of prefecture-level cities in Shanxi Province

表1 山西省地级市中心强度

地级市 城市经济总量(亿)Gi 第三产业总产量(亿)Yi 非农人口总量(万人)Ni 区位因子Pj 中心性强度
太原市 1747.77 949.28 347.05 0.0070 0.0436
大同市 659.65 320.83 182.37 0.0040 0.0101
阳泉市 422.79 167.49 82.16 0.0087 0.0114
长治市 879.99 278.32 139.62 0.0044 0.0105
晋城市 699.84 235.19 116.39 0.0054 0.0107
朔州市 629.61 250.6 79.44 0.0047 0.0082
晋中市 698.87 280.6 143.49 0.0033 0.0073
运城市 685.93 320.64 193.05 0.0033 0.0084
忻州市 388.24 193.15 116.22 0.0030 0.0045
临汾市 823.57 304.29 176.2 0.0028 0.0073
吕梁市 801.84 216.76 141.44 0.0030 0.0064
(3)创建山西省地级市常规Voronoi图(图2)。
Fig. 2 Regular Voronoi diagram of Shanxi Province

图2 山西省地级市常规Voronoi图

(4)以中心性强度为权重,创建山西省地级市及周边地级市加权Voronoi图,得到城市空间影响范围、山西省地级市Delaunay图。
在ArcGIS 9.3软件中,设置坐标系统为WGS-84,加载山西省地级市及邻省地级市行政中心的.shp文件,利用Weighted Voronoi Diagram扩展模块生成加权Voronoi图(图3)。在得到Voronoi图之后,生成Delaunay图。操作过程为:3D Analysis tools→TIN Management→Create TIN;3D Analysis tools→Conversion→From TIN→TIN Triangle。
Fig. 3 Weighted Voronoi grid diagram of the prefecture-level cities in Shanxi Province

图3 山西省地级市加权Voronoi栅格图

根据中心地的形成与Voronoi图的生成过程相匹配的特点,利用常规Voronoi图确定下一级中心地的位置。创建山西省地级市及邻省地级市常规Voronoi图,叠加山西省大同、吕梁、运城三座城市缓冲区,加载山西省县级城市行政中心,选择在缓冲区周边且与所对应地级市Voronoi多边形顶点周围的县级城市,分别为新绛县、绛县、垣曲县、兴县、静乐县、灵石县、汾西县、大宁县、隰县、浑源县、灵丘县和繁峙县,设这些县级城市为待发展城镇[10-11]
根据Delaunay图取得地级市之间距离,以地级市间平均距离145 km,给每个地级市创建缓冲区,逐一观察每个地级市的缓冲区范围,发现在大同、吕梁、运城3个地级市的缓冲区边缘或区域外存在其他地级市,其余8个城市在缓冲区范围内都存在其他地级市,说明大同、吕梁、运城3个地级市距离其相邻地级市距离较远,存在城市“空洞”,将该3个城市的缓冲区用分析工具裁剪出来,如图4所示。
Fig. 4 Discovery process of cities to be developed in Shanxi Province

图4 山西省待发展城镇的发现过程

(5)根据待发展城镇与道路、交通矢量图的GIS叠加,并依据经济人口情况,分析出待优先发展城镇。并把待优先发展的县级市添加到11个地级市中,创建山西省地级市及待优先发展城镇的常规Voronoi图(图5)。
Fig. 5 Regular Voronoi diagram with the addition of cities to be developed in Shanxi Province

图5 添加待发展县级城市后的山西省城市常规Voronoi图

(6)以平均配位数和 C v 值分别验证结果,如表2所示。
Tab. 2 Cvvalues of the prefectural-level cities in Shanxi Province compared to Cv values after the addition of the prioritized development counties

表2 添加待优先发展县城前后山西省城市Voronoi图的Cv值对比

地名 添加前城市Cv 添加后城市Cv
运城 0.46 2.65
吕梁 1.09 3.00
临汾 0.40 2.65
朔州 0.75 1.80
太原 1.22 2.45
忻州 1.04 2.65
晋中 1.05 2.24
晋城 0.37 2.65
长治 0.34 2.45
大同 1.79 2.45
阳泉 0.50 3.32
繁峙县 2.83
灵石县 2.45
新绛县 2.65

4 山西省城镇空间分布特征分析

4.1 山西省空间分布特征

山西省呈现南北发展不均衡的特征,与邻省相比较,山西省地级市空间分布特征如下:
(1)普遍存在城市空间影响范围不大的现象,只有太原市是影响范围较广的城市,其他地级市影响范围较小,尤其是吕梁、运城等位于山西省西南部的城市,既不受周边辐射,其自身影响范围也不大,亟需扩大其自身发展。
(2)省会城市太原的影响范围太大,给周边的忻州、晋中等地级市造成阴影,影响其快速发展;东西部发展较为不均衡,尤其是西北部城市影响范围极小。
考虑道路、河流、人口、经济发展等因素,本文在城市空洞与Voronoi多边形顶点位置周围选取了一些县级城市作为待发展城镇,根据空间分析,选取繁峙县、灵石县、新绛县为优先发展的县级市。

4.2 基于Voronoi图的验证方法与对比分析

首先,从平均配位数的角度来验证。对比图(2)与图(5),常规Voronoi图可以得到配位数,通过比较添加待发展城镇前后山西省城市Voronoi图的空间分布是否更加合理,配位数是否更接近理论值来验证结论。由图5可看出,添加待发展城镇后常规Voronoi图比原地级市常规Voronoi图更加稳定,布局更加均衡。原地级市常规Voronoi图的平均配位数为6.09,新增3个待发展城镇之后常规Voronoi图的平均配位数为6.07,更接近理论值。
其次,由表2可知,原山西省地级市 C v 值为0.33-0.64,属于随机分布,大于0.64属于集群分布;增加待优先发展城镇之后, C v 值均大于1,属于强变异,集群分布较为明显。验证结果表明,增加3个待优先发展城镇后,山西省地级市的常规Voronoi图分布更为集中和紧凑。
本文计算了山西省地级市中心强度及其周边地级市中心强度,分别生成了加权Voronoi图(图6)。从图6(a)中看出,只计算山西省地级市中心性强度不能客观、正确地反映山西省各地级市的空间影响范围,所有地级市的Voronoi多边形均不闭合,体现不出该城市的影响范围(山西省区域不完整)。其与山西省及周边地级市加权Voronoi图相比较,将山西省独立出来,不能较真实地反映山西省与周边城市的关系。所以,本文选择以山西省及周边地级市的生产总量、第三产业总量、城镇人口、区位因子为基础数据计算中心性强度,得到山西省及周边地级市加权Voronoi图,最后通过ArcGIS叠加分析得到山西省地级市空间影响范围(图6(b))。
Fig. 6 Comparison of spatial impact extent of the prefectural-level cities in Shanxi Province between analyses without and with the influence of neighboring provinces considered

图6 对是否受邻省地级市影响的山西省地级市空间影响范围前后对比

根据山西省城市发展现状来看,省会城市太原的发展抑制了周边城市的发展,使得忻州、晋中等城市空间影响范围限制呈现三角形,反映出太原经济对于这几个城市带来的冲击和影响,距离较远的临汾、长治等城市影响范围呈现出向周边辐射的正常态势。
根据上文中心性强度的属性表(表1)得知,阳泉的中心强度为0.0114,临汾的中心强度只有0.0073,然而临汾的空间影响范围却比阳泉要大,这主要是因临汾周围缺乏实力强大的城市,使其成为区域的中心城市,影响范围也较大,而阳泉在空间上离势力强大的太原市相对较近,受到其阴影的影响,与周围其他城市之间存在着激烈的空间“领地”竞争关系,符合实际情况。

5 结语

本文通过Voronoi图(包括加权Voronoi图)的数据挖掘对山西省地级市空间分布特征进行了分析。它直观地展现了城市行政中心的空间分布影响范围,并配合Delaunay图挖掘出了城市“空洞”,且得到待发展城镇等。同时,以 C v 值法验证认为,山西省作为一个空间分布对称强度较高的区域,可加深研究Voronoi图在城镇空间分布对称方面的作用。下一步将完善本文研究方法,使其自动化并在更多地方进行验证分析。

The authors have declared that no competing interests exist.

[1]
刘仙桃,郑新奇,李道兵.基于Voronoi图的农村居民点空间分布特征及其影响因素研究——以北京市昌平区为例[J].生态与农村环境学报,2009,25(2):30-33.

[2]
覃瑜,师学义.利用Voronoi图的城乡居民点布局优化研究[J].测绘科学,2012,37(1):136-150.

[3]
邹亚峰,刘耀林,孔雪松,等.加权Voronoi图在农村居民点布局优化中的应用研究[J].武汉大学学报·信息科学版,2012,37(5):560-563.

[4]
叶大年,赫伟,李哲,等.城市对称分布与中国城市化趋势[M].合肥:安徽教育出版社,2011.

[5]
张勇,余斌.基于ArcGIS环境下多类型数据的三角网和Voronoi图的生成[J].科技情报开发与经济,2008,18(4):149-151.

[6]
刘红娟. 关于高阶Voronoi图快速生成算法的研究[D].石家庄:河北师范大学,2008.

[7]
王新生,李全,郭庆胜,等.Voronoi图的扩展、生成及其应用于界定城市空间影响范围[J].华中师范大学学报,2002,36(1):107-111.

[8]
龙云飞,彭方志,陶睿.基于区域中心性强度的城镇群发展研究——以攀山地区为例[J]. 决策参考生产力研究,2012(10):116-118.

[9]
Duyckaerts C, Godefroy G.Voronoi Tessellation to study the numerical density and the spatial distribution of neurons[J]. Journal of Chemical Neuroanatomy, 2000,20(2):83-92.

[10]
陈述彭. 地学信息图谱探索研究[M].北京:商务印书馆,2001:120-180.

[11]
周海燕. 空间数据挖掘研究[D].郑州:中国人民解放军信息工程大学测绘学院,2003.

[12]
Han J, Fu Y.Discovery of multiple-level association rules from large databases[C]. Very Large Data Bases, 1995.

[13]
Yue T X, Zhou C H.An approach of differential geometry to data mining[C]. Proceeding of the International Symposium on Digital Earth, 1999.

[14]
Zhang T, Ramakrishnan R, Livny M.BIRCH: A new data clustering method and its applications[J]. Data Mining and Knowledge Discovery, 1997,1(2):141-182.

[15]
曲吉林,寇纪淞,李敏强,等.基于Voronoi图的异常检测算法[J].计算机工程,2007,33(23):35-39.

[16]
Wang J F, Liu X H, Peng L, et al.Cities evolution tree and applications to predicting urban grow[J]. Population Environment, 2012,33(2-3):186-201.

[17]
Wang J, Wang X Q. Edge-weighted centroidal Voronoi tessellations[J]. Global-Science Press, 2010,3(2):223-244.

[18]
蒲繁强. 基于分区加权Voronoi图的变电站选址研究[D].天津:天津大学,2008.

[19]
闫卫阳. 城市体系空间布局的模型化与智能化方法研究[D].武汉:武汉大学,2004.

Outlines

/