"Production-Living-Ecological Spaces" Recognition Methods based on Street View Images

  • WAN Jiangqin ,
  • FEI Teng , *
Expand
  • School of Resource and Environmental Sciences, Wuhan University, Wuhan 430079, China
*FEI Teng, E-mail:

Received date: 2022-07-21

  Revised date: 2022-10-08

  Online published: 2023-04-19

Supported by

National Natural Science Foundation of China(42271476)

351 Talent Program of Wuhan University(2020007)

Abstract

Understanding the urban spatial pattern from the perspective of the “Production-Living -Ecological” function not only paves the way to the optimization of land spatial structure, but also reflects the internal functional form and combination mode of urban land. However, in the past, the recognition of urban “Production-Living -Ecological Spaces” (PLES) mainly relied on remote sensing images, Point of Interest (POI), and land use data, and there was a lack of three-dimensional information within a city. Street View Images (SVI) can reflect the characteristics of the streets in the city and capture large-scale and high-resolution objective measurements of the physical environment within a street from a close-up view. Therefore, based on the semantic features of the scene extracted from the SVI, this paper proposes a method of identifying PLES in the central urban area and analyzing the importance of different features of the PLES. Taking the Fourth Ring Road of Chengdu as the study case, the classification system of PLES is constructed based on POI data, and the proportion of PLES is calculated at each SVI sampling point. The eXtreme Gradient Boosting (XGBoost) algorithm is used to identify the urban PLES, and a comparative test of model accuracy is also carried out. The spatial distribution of PLES in the study area is analyzed from three scales, i.e., road network, 500-m grid, and traffic analysis zone. The SHapley Additive exPlanation (SHAP) method is introduced to identify the important features that contribute to PLES. The results are as follows: (1) The proposed method of identifying PLES based on SVI in this paper has a high accuracy. The R2 of the model for identifying PLES reaches 0.6, indicating the feasibility of SVI for identifying PLES; (2) The spatial pattern of PLES reveals that the study area is dominated by production-living spaces, which are large in number and distributed in pieces in the study area. The number of units dominated by ecological space is small, and they are mainly distributed in large parks; (3) Among the semantic features of the seven types of scenes, street openness and motorization level have the greatest impact on the formation of the PLES. Based on PLES, this study uses SVI data to conduct a fine-scale analysis of land use in central urban areas and determine the types of urban land. This paper enriches the data and methods of PLES identification and provides a new tool for the optimization of urban spatial structure and development decision making.

Cite this article

WAN Jiangqin , FEI Teng . "Production-Living-Ecological Spaces" Recognition Methods based on Street View Images[J]. Journal of Geo-information Science, 2023 , 25(4) : 838 -851 . DOI: 10.12082/dqxxkx.2023.220534

1 引言

十八大报告中明确指出国土“生态—生产—生活空间”的发展目标,即构建“生产空间集约高效、生活空间宜居适度、生态空间山清水秀”的“三生空间”[1]。“三生空间”的概念源于农业多功能性[2],但随着研究的不断深入,多功能性不仅限于农业领域,各种土地利用类型和景观都具有多功能性[3-5]。从土地利用多功能的角度,土地利用可分为生产、生活和生态3种功能空间,涵盖生物物理过程、直接和间接生产以及精神、文化、休闲、美学的需求满足等,是自然系统和社会经济系统协同耦合的产物[6-7]。其中,生产空间是指直接通过土地获取或以土地为载体进行社会生产获取产品和供给功能的空间,如工业采矿建设区和农业生产区等;生活空间是承载和保障人类生存和发展过程中的居住、消费、休闲、娱乐等需求的空间,比如居住小区、商场等场所;生态空间则是以调节、维持和保障生态产品和生态服务为主导功能的空间,如草地、林地等空间。“三生空间”作为一种新的土地利用分类体系,这一概念的提出对于解决当前城乡发展困境、优化城市层面的实体空间布局、建设生态文明具有重要的理论和应用价值[8]
准确识别“三生空间”,特别是在城市层面实现生态、农业和城市空间利用的识别,是优化土地利用和实现区域尺度可持续社会的有效手段[9]。目前,“三生空间”识别主要从定性和定量2个角度进行,定性方法是根据国家土地利用标准将不同土地利用类型归并为不同空间,更多从国家[10]、省域[11]等中宏观尺度识别“三生空间”,操作较为简单,但难以精确地识别各地块的土地利用主导功能空间。定量方法是根据影响“三生空间”的社会、经济、自然等因素构建指标体系,后采用专家打分法[12]、熵权法[13]、空间分析[14]和机器学习[15]等方法进行功能评估,识别“三生空间”,这一方法在中宏观尺度和市域、县域等微观尺度均有应用,具有针对性和综合优势,但尚未形成统一的标准体系。此外,针对微观尺度的中心城区和建成区的“三生空间”识别主要是基于土地利用、兴趣点(Point of Interest, POI)等数据进行,如李广东等[7]从理论和实践2个层面建立城市“三生空间”功能体系,使用土地利用、统计和生态监测等多源数据对杭州市余杭区塘栖镇进行了“三生空间”功能定量测度;曹根榕等[16]利用POI数据样本量大、易获得、涵盖信息细致等优势,构建了中心城区尺度下“三生空间”分类体系,并在上海市中心城区进行了“三生空间”的识别与分析。以上在中心城区尺度的研究多在图斑和格网单元上进行,通过具有俯视角度地物信息的土地利用数据和具有社会经济信息的POI数据识别“三生空间”。然而,土地利用数据更多地由遥感图像解译而来,遥感影像缺乏地面细节信息,难以区分具有相似光谱特征的土地利用类型[17]。POI数据可以反映土地的社会经济特征,但其具有的类别信息表达能力有限[18]。对于地物类型多样和土地利用混合情况复杂的中心城区,土地利用数据和POI数据进行“三生空间”识别存在一定的局限性。
街景图像(Street View Images, SVI)作为表达城市环境的一种新型大数据源,可以捕捉到建筑环境和行人互动最多的城市场景,提供了近距离的从立体剖面图视角来表征城市物质空间环境的可能性[19]。近年来,街景图像已逐渐成为城市土地利用研究的重要数据源。一方面,以往研究将街景图像作为POI[20]和遥感影像[17]等社会经济、俯视数据的补充,利用深度学习技术进行土地利用分类,从而更精确地识别土地利用类型。另一方面,有研究直接通过提取街景图像中的特征进行城市土地利用分类,从街景图像中提取出SIFT、GIST等中层特征用于区分住宅建筑和非住宅建筑[21],或是利用深度学习算法根据街景图像中像素级的高级语义信息识别教育机构、医院和公园等城市细粒度土地利用类型[22]。更有研究在中心城区中证实了街景图像中的场景层语义信息与城市土地利用功能类型的相关性,不同的土地利用类型对街景图像中提取聚合的绿视率、街道开敞度和界面围合度场景层特征有着不同的显著影响[23]。而“三生空间”作为一种新的土地利用分类体系,以土地利用多功能为依据进行分类。因此,从理论角度来看,使用街景图像识别“三生空间”具有可行性。街景图像具有城市立面信息、覆盖面广、分辨率高的特点,采用定量方法能得到不同区域的土地混合利用情况,进行“三生空间”分布制图,主要优点如下:① 街景图像可以弥补遥感影像缺乏的近距离感知能力,客观地体现城市土地细节信息,反映城市土地的社会经济用途[24],提供了精确识别“三生空间”的条件;② 街景图像包含丰富的视觉信息,利用深度学习技术可以得到城市内部建成环境的多维信息,如建筑、道路的比例信息,这些体现人类日常活动环境的信息从其他类型的数据中不易获得,更能全面、整体和精细化的描绘城市建成环境[25],有助于挖掘人类活动对“三生空间”的影响。然而,目前缺乏实证研究证明街景图像在“三生空间”识别中的价值。
因此,本研究以成都市中心城区作为研究区,将POI数据提取的“三生空间”比例作为真值,提出一种基于街景图像场景语义特征的“三生空间”识别方法,探讨街景图像这一数据识别“三生空间”的可行性,并分析成都市中心城区“三生空间”格局分布,探索不同特征的重要性。

2 研究方法

研究步骤主要有以下4点:① 利用金字塔场景解析网络(Pyramid Scene Parseing Network, PSPNet)对街景图像进行语义分割,提取出7维场景层特征;② 参考前人文献中基于POI数据构建的中心城区尺度下的“三生空间”分类体系,计算得到每个街景图像采样点三类空间的比例;③ 引入梯度极限提升算法(eXtreme Gradient Boosting, XGBoost)构建“三生空间”识别模型,与其他回归模型进行对比分析;④ 分析识别结果,在3个尺度上进行“三生空间”分布制图,并基于沙普利加和解释(SHapley Additive exPlanation, SHAP)方法进行可解释性分析,以定量计算街景图像场景层特征对“三生空间”的重要性。
本研究的技术路线如图1所示。
图1 研究方法技术路线

Fig. 1 Research method and technology framework

2.1 街景图像场景层特提取

在街景图像特征提取中,常用的语义分割方法有FCN、SegNet、PSPNet等。PSPNet是在FCN基础上改进而来的模型,可以结合局部和全局信息提升语义分割的性能,通过引入金字塔池化模块提取图像深层和浅层的特征,后融合以降低误分割的概率,其数据分类精度较高,是当下使用较为广泛的图像识别算法之一[26]。在MIT ADE20K数据集上预训练的PSPNet模型,使用改进后的ResNet50和金字塔池化模块分别作为编码器和解码器进行场景解析,分割精度可达79.73%(https://github.com/CSAILVision/semantic-segmentation-pytorch[27]。因此,本研究通过这一模型对街景图像进行分割获取不同语义对象(如树木、建筑物、人行道、自行车等)。
使用PSPNet模型对街景图像进行语义分割流程如图2所示,研究以MIT ADE20K数据集(http://sceneparsing.csail.mit.edu/)作为样本数据训练模型,该数据集包含2万多张城市场景图像,来自于不同季节的50个城市,共有150个语义类别。进行语义分割包含4个步骤:① 输入街景全景图像,大小为360像素×1024像素; ② 使用ResNet50基础网络进行特征提取,得到最后一个卷积层的特征图; ③ 使用金字塔池化模块获取特征图不同区域的上下文信息,此过程具有4个不同的金字塔尺度的池化,即1×1、2×2、3×3和6×6; ④ 将金字塔池化模块后得到的特征输入卷积层得到每个像素的预测语义类别并生成像素层语义图像。输出图像大小与输入相同,均为360像素×1024像素。由于采集的实验图像存在少部分语义类别缺失问题,最终得到141类不同类别的语义,其数值即模型得到的不同语义类别所占像素数在整张图像中的占比。
图2 街景图像PSPNet语义分割流程

Fig. 2 Flowchart of PSPNet semantic segmentation of SVI

已有文献证实了从街景图像中提取聚合的绿视率、街道开敞度和界面围合度3个场景层语义特征可以在一定程度上反映街道的土地利用功能[23]。绿视率反映了区域内的绿化程度,街道开敞度和界面围合度能体现区域内建筑密度和天空的可见程度。此外,根据经典的城市设计文献和不同街景语义的功能类型[28-30],机动化程度可以体现区域内道路分布和车流量情况,行人空间能反映区域的行人活动和步行街道设施水平,水体和景观物的出现率则可以体现区域内生态景观状况。
因此,研究将图像语义分割后得到的141维像素层语义特征筛选聚合为绿视率、街道开敞度、界面围合度、机动化程度、行人空间、水体出现率和景观物出现率7类场景层语义特征。如表1所示,绿视率表示为树木、草和其他植被比例的总和;街道开敞度是天空的比例;界面围合度主要为建筑立面比例,为建筑、房屋、墙面、窗户、柱子等物体比例的总和;机动化程度为机动化道路和各类机动车的总和;行人空间可计算为行人、自行车和步行街道设施的比例总和,其中步行街道设施包括人行道、防护栏、盲道、路灯、垃圾桶等设施;水体和景观物占比分别为湖、河等水体和塔、雕塑等景观的比例的总和。
表1 街景图像场景层语义与像素层语义对应表

Tab. 1 Correspondence table between scene layer semantics and pixel layer semantics of SVI

序号 场景层语义 像素层语义
1 绿视率 树木、草、植物等
2 街道开敞度 天空
3 界面围合度 建筑、房屋、墙面、窗户、柱子等
4 机动化程度 机动化道路和各类机动车的总和
5 行人空间 行人、自行车和步行街道设施
6 水体占比 湖、河等
7 景观物占比 塔、雕塑、喷泉等
考虑到单个街景图像采样点无法全面地表达其周围街道的环境,从而影响“三生空间”的识别效果,研究统计了街景图像采样点500 m缓冲区内所有街景图像的场景层语义的均值作为该点的场景层语义值,即回归模型输入的自变量。

2.2 POI数据的“三生空间”分类

参考已有文献[16]构建基于POI数据的中心城区尺度的“三生空间”分类体系,在删除ATM和公共卫生间等对城市用地影响不大的类型的POI后,根据POI小类进行重分类,以映射到生产、生活和生态空间。考虑不同类型POI和“三生空间”的相关性不同,比如对于生活空间而言,居住区的相关度比休闲娱乐的更强;以及POI对应实体的占地面积对于“三生空间”识别的影响,如某个缓冲区内,公园绿地POI个数小于交通设施POI个数,但一般公园绿地POI的占地面积远大于交通设施的占地面积,应将该单元识别为生态空间。因此,需要对不同类型的POI进行赋权,在此引用李建春等[31]对不同POI类型的权重设置,如表2所示。
表2 基于“三生空间”的POI类型分类

Tab. 2 Classification of POI types based on the “Production-Living-Ecological Spaces” (PLES)

类型 大类 中类 对应POI类型 相关度α 范围度β 综合权重λ
生产空间P 生产性服务空间 公司企业P1 商业贸易、网络科技等 0.340 0.300 0.102
金融保险P2 银行、保险机构等 0.150 0.300 0.045
农业空间 农林基地P3 农林牧副渔等生产基地 0.240 0.600 0.144
工业空间 工厂园区P4 工厂、产业园区等 0.370 0.700 0.259
仓储物流P5 仓储基地、物流速递等 0.110 0.300 0.033
管理空间 政府机构P6 机关单位、行业协会等 0.060 0.300 0.018
交通空间 交通设施P7 公交车站、停车场等 0.050 0.150 0.008
生活空间L 生活性服务空间 餐饮服务L1 中餐厅、冷饮店等 0.100 0.100 0.010
购物服务L2 超市、商场、便利店等 0.110 0.150 0.017
生活服务L3 美容美发、邮局、洗衣店等 0.110 0.100 0.011
医疗保健L4 医院、诊所、疗养院等 0.210 0.200 0.042
科教文化L5 学校、科研机构等 0.120 0.300 0.036
娱乐休闲L6 运动场所、游乐场等 0.070 0.100 0.007
住宿服务L7 酒店、宾馆等 0.140 0.100 0.014
居住空间 居住区L8 住宅、别墅等 0.550 0.500 0.275
生态空间E 绿地空间 公园绿地E1 公园广场、植物园等 0.600 0.900 0.540
风景名胜E2 旅游景点、宗教寺庙等 0.390 0.800 0.312
户外绿地E3 露营地、高尔夫球场等 0.270 0.450 0.122
统计每个街景图像采样点500 m缓冲区内重分类后不同类型POI数量,根据权重计算每个街景图像采样点缓冲区内的各类“三生空间”的综合数量,其计算公式如下:
S i = j n λ i j × c i j , i , j = 1,7 , 2,8 , 3,3
式中: S i表示第 i空间的综合数量; λ i j表示第 i类空间的第 j类POI的综合权重; c i j表示缓冲区内第 i类空间的第 j类POI点的数量。
最后,计算街景图像采样点生产、生活、生态 3类空间所占的比例,作为回归模型输入的因变量,即该点“三生空间”类型的真值。

2.3 “三生空间”回归模型构建

为分析从街景图像中提取的场景层特征与不同“三生空间”类型的相关性,研究选取XGBoost算法构建回归模型。XGBoost是基于决策树的集成机器学习算法,是对Boosting算法的一种优化,以梯度提升为框架,将弱分类器集成为一个强分类器[32]。XGBoost算法根据损失函数在梯度下降方向上不断迭代,组合多个CART树,随着迭代次数的增多,损失函数逐渐降低,精度不断提升。此外,XGBoost利用了二阶泰勒展开信息,在代价函数中加入了正则项,防止过拟合,提高模型的求解效率,支持并行计算,适合处理大规模数据。XGBoost 算法在空间分布预测相关研究中被广泛应用且表现出更优的性能,如土地覆盖变化[33]、空气质量预测[34]和房价预测[35]等。
因此,本研究分别将通过POI得到街景图像采样点的不同“三生空间”类型比例作为因变量,街景图像7维场景层作为自变量,采用XGBoost算法构建生产、生态和生活3个回归模型,得到同一街景图像采样点的不同“三生空间”的比例。

2.4 “三生空间”回归结果分析

本研究使用决定系数(Coefficient of Determination, R2)和均方误差(Mean Squared Error, MSE)作为衡量模型效果的评价指标,如式(2)和式(3)所示。R2是用来体现因变量的变异中可由回归关系被自变量解释的比例,取值在[0,1]之间,值越大,回归效果越好。MSE用于衡量预测值与真值之间的差异,值越小,说明模型预测越准确。
R 2 = 1 - i = 1 n y i - y ˆ i 2 i = 1 n y i - y - 2
M S E = 1 n i = 1 n y i - y ˆ i 2
式中: y i为样本真值; y ˆ i为模型预测值; y -为真值均值; n为样本数。
为分析XGBoost算法在“三生空间”识别任务上的性能,选取了几种常见的回归模型进行比较,包括普通最小二乘法(Ordinary Least Square, OLS)、支持向量机(Support Vector Machine, SVM)和梯度提升回归树(Gradient Boosting Regression Tree, GBRT)。其中,OLS是经典的线性回归模型;SVM基于核函数理论,将线性不可分数据进行映射后实现数据的线性可分,在回归问题的不同领域表现出较好的性能;GBRT和XGBoost类似,也是一种基于Boosting策略的树模型,可以自动进行特征组合,拟合非线性数据,但在优化时只用到了一阶导数信息,多用于回归问题中。
为进一步探索街景图像场景层特征与“三生空间”之间的关系,选择基于不纯度的特征重要性(Mean Decrease Impurity, MDI)、排列重要性(Permutation Importance, PI)和SHAP值对模型进行解释。其中MDI通过计算每个特征带来的不纯度减少的平均值对特征进行排序;PI是在模型训练完成后,随机重排特征,根据模型表现评分的下降程度确定特征的重要性程度。但以上2个指标均无法得到特征对模型方向的影响。SHAP是基于博弈论的可解释机器学习方法[36],它可以基于蒙特卡罗抽样方法计算每个变量对应的SHAP值,量化自变量对因变量的影响,包括方向和数值,弥补XGBoost算法在变量可解释性方面的不足。
此外,为直观合理的对土地多功能混合利用的空间类型进行描述分析,研究将回归模型得到的采样点的3种空间预测值在500 m格网和交通分析区(Traffic Analysis Zone, TAZ)上进行统计平均,并在3个尺度下将不同空间预测值作为RGB值输入,进行“三生空间”多功能混合利用分布格局制图分析。

3 研究区概况及数据来源

3.1 研究区概况

研究区成都市是西南地区重要的中心城市,下辖12个区、5个县级市和3个县。全市土地面积14 335 km2,市区面积3639.8 km2,中心城区建成区面积977.12 km2。成都市自然生态环境良好,构建了全域公园体系,实施全域增绿项目2888个,新增绿地18.61 km2、立体绿化0.24 km2,森林覆盖率为40.2%[37]
成都四环线作为第一绕城高速公路,总长 84.96 km,穿行成都中心城区一圈,内部区域包括锦江区、武侯区、青羊区、金牛区和成华区5个核心城市建成区。四环内基础服务设施完善、人口稠密、路网密集、商业繁华,拥有功能丰富的城市用地。同时,成都市中POI和街景图像大多均匀分布在四环区域内,分布位置大致相同,考虑POI和街景图像在城市中心地区和郊区分布不均的限制,选择成都市四环内作为研究区,如图3(a)图3(b)所示。
图3 研究区及数据分布

Fig. 3 Study area and data distribution map

3.2 数据来源与处理

路网数据通过Open Street Map(OSM)网站(https://www.openstreetmap.org/)下载,研究区内共16 760条道路,其中高速及高架公路1945条,一级道路1387条,二级道路1604条,三级道路2106条,其他机动车道和非机动车道9718条,如图3(c)所示。
采样距离过大可能会引起数据覆盖不完全的问题,但街景图像的可视范围通常在50 m以上。因此,综合考虑细节水平和成本,选用50 m作为采样间隔,这一距离在前人研究中也多被采用[38-40]。之后通过百度地图开放平台的全景静态图API(http://lbsyun.baidu.com/index.php?title=viewstatic)获取每个采样点的360°全景图,采样时间为2020年8月,图像大小为360像素×1024像素。经统计在研究区内共获取97 711张街景图像,删去240张周围无任何POI数据的图像,最终得到97 471张街景图像,其分布情况如如图3(d)所示,与POI点的分布情况大致相同,在研究区内分布较为均匀。
POI数据来源于高德(https://www.amap.com/),研究区内共计189 326条数据,14个大类,105个小类,382个小类,其中大类包括餐饮服务、购物服务、科教文化服务、风景名胜、公共设施、公司企业、交通设施服务、金融保险服务、商务住宅、生活服务、体育休闲服务、医疗保健服务、政府机构及社会团体和住宿服务,每个大类下又包含若干中类和小类。每个POI主要包含4个核心字段:POI名称、三级类别类型、地址和地理坐标,数据示例如表3所示。POI数据较为全面的覆盖了本文的研究区域(图3(e))。
表3 研究区POI数据示例

Tab. 3 Examples of POI data in the study area

名称 大类 中类 小类 地址 经度/°E 纬度/°N
好佰家超市 购物服务 超级市场 超市 金芙蓉大道北150 m 104.05 30.74
泡桐树小学(天府校区) 科教文化服务 学校 小学 锦尚西二路299号附1 104.05 30.58
小陈串串香(青森街) 餐饮服务 中餐厅 火锅店 苏坡街道青森北路苏坡立交青森街一号附45 103.99 30.67
确定研究尺度是进行“三生空间”格局分析的保证,道路尺度可以反映街景图像采样点周围的土地利用情况,但主要是针对采样点进行分析。以往研究对于“三生空间”的研究多在格网尺度进行[16],但格网尺度得到的结果与现实规划形态存在较大差异。TAZ是由交通管理部门根据城市交通主干道进行划分的空间统计单元,承载了城市居民日常的社会经济活动,与实际的街区范围相符合,是城市功能划分的基本单位[41]。为了更全面的分析研究区内“三生空间”的分布格局,本研究将从道路、格网和TAZ 3个尺度进行分析。
道路尺度通过对街景图像采样点数据设置 500 m缓冲区得到,研究区内共计97 471个采样点缓冲区。格网单元采用ArcGIS的渔网工具提取,在研究区域内含2261个500 m×500 m的正方格。TAZ划分根据数学形态学方法[42],使用经数据清洗和拓扑处理后的7042条三级以上道路完成TAZ划分工作。具体步骤为:① 将路网转化为二值化图像并进行3×3结构元素矩阵的膨胀以消除立交桥等多余细节;② 进行细化操作得到道路网络骨架,从二值化图像中提取中心线;③ 使用连通区域标记算法对图像进行聚类,标记不同TAZ区域;④ 将栅格图像转换为矢量面状数据,生成TAZ,将面积小于0.1 km2的地块融合到相邻地块,最终得到966个TAZ(图3(b))。

4 结果及分析

4.1 模型精度对比分析

本研究按照7:3比例划分训练集和验证集,使用XGBoost模型进行回归,得到街景图像采样点的不同“三生空间”比例,并进行多模型对比分析,各模型参数设置如表4所示。
表4 不同模型参数设置

Tab. 4 Parameter settings of different models

模型 参数 取值 模型 参数 取值
OLS missing none OLS hasconst None
SVM kernel rbf SVM gamma auto
C 1000 cache_size 200
GBRT n_estimators 300 GBRT max_features None
loss ls max_depth 5
subsample 0.8 min_samples_split 50
learning_rate 0.1 min_samples_leaf 30
XGBoost n_estimators 300 XGBoost eta 0.3
min_child_weight 3 max_depth 7
subsample 0.8 gamma 0.2
learning_rate 0.1 colsample_bytree 0.8
最终得到各模型精度如表5,XGBoost模型在“三生空间”识别中获得了最高的R2和更低的MSE,在生产、生活和生态空间的R2均为0.6以上,其中生活空间R2为0.65。对比4个模型,发现基于决策树的GBRT和XGBoost比OLS和SVM的精度更高,这表明相较于线性分类器,树模型在“三生空间”的识别上更有优势。观察生产、生活和生态空间在不同模型上的识别结果,除GBRT为生态空间拟合结果最好外,其余模型在生活空间的识别效果表现更优,其中SVM模型在生活空间与生产、生态空间的结果相差最大,分别为0.09和0.11。
表5 基于不同模型的对中心城区“三生空间”识别结果准确性评价

Tab. 5 Accuracy evaluation of the results of the identification of the PLES in the central urban area based on different models

“三生空间”类型 R2 MSE
OLS SVM GBRT XGBoost OLS SVM GBRT XGBoost
生产空间 0.12 0.23 0.49 0.61 0.05 0.04 0.03 0.02
生活空间 0.19 0.32 0.55 0.65 0.04 0.03 0.02 0.02
生态空间 0.10 0.21 0.57 0.62 0.01 0.01 0.01 0.01

4.2 “三生空间”格局分析

综合道路、500m格网和TAZ尺度的“三生空间”分布情况(图4图5),可以得到成都市中心城区各类空间的分布格局特征。生产空间主要分布在外环,呈现出连片分布状态,与产业园区、仓储基地和大型交通设施分布大致相同,在内环呈零星点状分布;生活空间沿路网呈辐射状发散,内环呈圆弧状分布,外环地带更多呈点状分布;生态空间在中心城区数量较少,集中分布在几个大型森林公园和湿地公园处。
图4 道路和500m格网尺度下基于颜色合成的“三生空间”分布可视化

Fig. 4 Visualization of PLES distribution based on color synthesis at road network and 500m grid scale

图5 TAZ尺度下基于颜色合成的“三生空间”分布及选点分析

Fig. 5 Spatial distribution of PLES based on color synthesis at TAZ scale and point selection analysis

根据图4图5分析中心城区土地多功能混合利用的情况,生产空间和生活空间混合程度较高,3个尺度下分布图大部分区域以红色和蓝色混合的紫色为主;生产-生态空间、生活-生态空间和生产-生活-生态空间数量较少,在外环东南处呈成片状分布,在外环东西两侧和东北区域呈零星分布。
为验证模型预测的“三生空间”的准确性,在TAZ尺度选取了红、绿、蓝3种颜色纯度较高的地块与高德地图上同经纬度的区域进行比较(图5(b)图5(d)),二者功能类型大致相同,说明构建的回归模型识别结果较好。
观察图4图5分析不同尺度下“三生空间”分布可知,3个尺度下“三生空间”的位置分布较为一致,生产空间主要分布在外环,生活空间分布在内环,生态空间为主导的区域数量较少。但对不同尺度的土地利用混合程度分析,在道路尺度上“三生空间”的分布更为独立,红、绿、蓝3种颜色更为突出。随着尺度的变大,纯色地块减少,混合利用程度增加,如在图5中基本无法观察到纯绿色的生态空间分布。此外,观察3个尺度的着色面积,尺度越大,着色面积越大,空白区域越少,可识别的“三生空间”面积越多,与实际规划更接近。

4.3 模型特征重要性分析

分析XGBoost模型的特征重要性,从表6可知,在MDI指标中,生产空间最重要的特征是街道开敞度、机动化程度、水体占比和景观物占比;生活空间为街道开敞度、机动化程度和界面围合度;生态空间则是界面围合度和街道开敞度。在PI指标中,生产空间最重要的特征为街道开敞度、水体占比、机动化程度和景观物占比;生活空间为街道开敞度、机动化程度和水体占比;生态空间则是界面围合度、街道开敞度和绿视率。但是MDI和PI没有方向,无法判断其对结果的影响方向,只能确定特征和不同“三生空间”有关的程度。
表6 基于MDI和PI的XGBoost模型特征重要性

Tab. 6 Feature importance table of XGBoost model based on MDI and PI

特征 MDI PI
生产空间 生活空间 生态空间 生产空间 生活空间 生态空间
绿视率 0.13 0.12 0.14 0.19 0.16 0.28
街道开敞度 0.22 0.26 0.15 0.43 0.51 0.32
界面围合度 0.13 0.13 0.19 0.18 0.17 0.41
机动化程度 0.14 0.16 0.14 0.24 0.28 0.23
行人空间 0.11 0.10 0.13 0.21 0.19 0.13
水体占比 0.14 0.12 0.13 0.26 0.23 0.15
景观物占比 0.14 0.12 0.14 0.24 0.21 0.18

注:表中绿-黄-红色阶表征不同特征重要性程度由小至大的排序情况。

利用SHAP方法对XGBoost模型进行可解释性分析,观察图6(a)图6(b)发现,生产空间最重要的3个特征是街道开敞度、机动化程度和水体占比,具有更高的街道开敞度和更低的机动化程度、水体占比、行人空间、绿视率的地方,其生产空间比例越高。观察图6(c)图6(d)可知,对生活空间而言,街道开敞度、机动化程度和行人空间更重要,具有更低的街道开敞度和更高的机动化程度、行人空间的地方,其生活空间比例越高。根据图6(e)图6(f)可知,对生态空间来说,最重要的是街道开敞度、界面围合度和绿视率,具有更高的街道开敞度、绿视率和更低的界面围合度的地方,生态空间比例越高。
图6 基于SHAP值的XGBoost模型“三生空间”特征重要性分析

Fig. 6 Analysis of feature importance for PLES based on the SHAP value

5 讨论

本研究以POI数据作为中心城区“三生空间”分类体系标准,基于街景图像对成都市中心城区进行“三生空间”识别,证明了街景图像识别“三生空间”的可行性,分析了成都市中心城区“三生空间”分布格局及混合利用情况,并对各类空间进行了特征重要性分析。
研究从3个尺度对成都市中心城区“三生空间”的分布格局进行分析,并与高德地图上相同区域进行比较,验证模型准确性。结合3个尺度分析“三生空间”的分布发现随着研究单元的变大,单一空间的数量减少,生产、生活和生态空间比例大于0.7以上的地块数量占比分别由最初的7.53%变为3.83%、7.15%变为3%、0.45%变为0,这可能是因为研究单元越大,地块逐渐融合,土地利用功能混合程度也随之增大。
特征重要性分析发现,街道开敞度与生产空间为正相关,而机动化程度、水体占比、行人空间和绿视率与生产空间为负相关。因为在中心城区,生产空间以工业和服务业为主,更多的建筑为公司、产业园和物流基地,其间建筑物单一低矮,从而具有更宽阔的视野和更少的机动车、水体、行人、步行街道设施和绿化。对于生活空间来说,模型显示其间具有更低的街道开敞度、更高的机动化程度和行人空间,这是因为在生活空间中,人类出行的频率更高,人类生活需要更多的居住空间、道路设施、交通工具和步行街道设施。而就生态空间来看,绿视率和街道开敞度与生态空间呈正相关,界面围合度与生态空间为负相关,这与生态空间关注环境保护的内涵相一致。
该方法仍然存在一定的局限性。① 街景图像无法体现季节的变换,采样时间会影响生态空间的识别效果;② 由于难以获取土地利用的实地调查数据,参考前人研究以POI数据构建的中心城区“三生空间”分类体系作为土地利用真值[16,31],会对街景图像识别“三生空间”的效果产生影响,难以全面分析街景数据的适宜性;③ 只研究了单一时间的“三生空间”分布格局,并未探究各类空间的动态演化过程;④ 研究为探究街景图像进行“三生空间”识别的贡献,只使用了街景图像单一数据源进行“三生空间”识别,但街景图像属于平视数据,无法体现城市的空间范围特征,会影响“三生空间”的识别效果。因此,在后续的研究中,将考虑以上问题,与俯视数据结合,使用多时相街景图像和遥感影像分析城市“三生空间”演化动态规律。

6 结论

本研究提出了一种新的识别中心城区“三生空间”的方法,从街景图像中提取出城市垂直立面的场景层特征进行“三生空间”识别,并进行特征重要性分析。研究结论如下:① 街景图像可作为中心城区“三生空间”识别的新数据,提出的方法具有较好的效果,模型识别生产、生活和生态空间的R2分别为0.61、0.65和0.62;② 研究区生产空间在外环分散,生活空间沿路网辐射分布,生态空间分布在大型公园和湿地处,966个TAZ单元中,以生产-生活空间为主导(789,占81.68%),以生态空间为主的单元数量较少(9,占0.93%),需要增加生态空间用地;③ 街道开敞度和机动化程度对不同类型空间影响最大,在生产和生态空间中,二者的平均SHAP值排位第一和第二,在生态空间中,二者的平均SHAP值排位为第一和第四,“三生空间”的特征重要性差异可以为未来城市规划建设提供参考。
本研究基于街景图像进行“三生空间”识别,其创新性如下:①采用“三生空间”的土地利用分类体系,更符合我国的国土空间开发和空间规划体系构建导向;②探索了街景图像单一数据源识别“三生空间”的有效性,从街景图像中提取街道内部的场景层特征拟合“三生空间”分布情况;③基于SHAP方法对模型进行解释,尝试分析“三生空间”的特征重要性,从城市内部物理特征来分析不同空间中各类场景层特征的情况。
综上所述,本研究以“三生空间”为依据,使用街景图像单一数据源进行城市用地类型识别,可以实现中心城区土地利用分析,为国土空间规划和城市化进程提供辅助支持。
[1]
习近平. 关于《中共中央关于全面深化改革若干重大问题的决定》的说明[J]. 求是, 2013(22):19-27.

[Xi J P. Explanation of “decision of the central committee of the communist party of China on comprehensively deepening the reform of some major issues”[J]. Qiushi, 2013(22):19-27.]

[2]
Wiggering H, Dalchow C, Glemnitz M, et al. Indicators for multifunctional land use—Linking socio-economic requirements with landscape potentials[J]. Ecological Indicators, 2006, 6(1):238-249. DOI:10.1016/j.ecolind.2005.08.014

DOI

[3]
Zhou D, Xu J C, Lin Z L. Conflict or coordination? Assessing land use multi-functionalization using production-living-ecology analysis[J]. Science of the Total Environment, 2017, 577:136-147. DOI:10.1016/j.scitotenv.2016.10.143

DOI

[4]
武占云. “三生”空间优化及京津冀生态环境保护[J]. 城市, 2014(12):26-29.

[Wu Z Y. Space optimization of “Production-Living-Ecological lives” and ecological environment protection of Beijing, Tianjin and Hebei[J]. City, 2014,(12):26-29.]

[5]
De Groot R. Function-analysis and valuation as a tool to assess land use conflicts in planning for sustainable, multi-functional landscapes[J]. Landscape and Urban Planning, 2006, 75(3-4):175-186. DOI:10.1016/j.landurbplan.2005.02.016

DOI

[6]
刘继来, 刘彦随, 李裕瑞. 中国“三生空间”分类评价与时空格局分析[J]. 地理学报, 2017, 72(7):1290-1304.

DOI

[Liu J L, Liu Y S, Li Y R. Classification evaluation and spatial-temporal analysis of “production-living-ecological” spaces in China[J]. Acta Geographica Sinica, 2017, 72(7):1290-1304.] DOI:10.11821/dlxb201707013

DOI

[7]
李广东, 方创琳. 城市生态—生产—生活空间功能定量识别与分析[J]. 地理学报, 2016, 71(1):49-65.

DOI

[Li G D, Fang C L. Quantitative function identification and analysis of urban ecological-production-living spaces[J]. Acta Geographica Sinica, 2016, 71(1):49-65.] DOI:10.11821/dlx b201601004

DOI

[8]
黄金川, 林浩曦, 漆潇潇. 面向国土空间优化的三生空间研究进展[J]. 地理科学进展, 2017, 36(3):378-391.

DOI

[Huang J C, Lin H X, Qi X X. A literature review on optimization of spatial development pattern based on ecological-production-living space[J]. Progress in Geography, 2017, 36(3):378-391.] DOI:10.18306/dlkxjz.2017.03.014.

DOI

[9]
刘春芳, 王奕璇, 何瑞东, 等. 基于居民行为的三生空间识别与优化分析框架[J]. 自然资源学报, 2019, 34(10):2113-2122.

DOI

[Liu C F, Wang Y X, He R D, et al. An analysis framework for identifying and optimizing ecological-production-living space based on resident behavior[J]. Journal of Natural Resources, 2019, 34(10):2113-2122.] DOI:10.31497/zrzyxb.20191008

DOI

[10]
张红旗, 许尔琪, 朱会义. 中国“三生用地”分类及其空间格局[J]. 资源科学, 2015, 37(7):1332-1338.

[Zhang H Q, Xu E Q, Zhu H Y. An ecological-living-industrial land classification system and its spatial distribution in China[J]. Resources Science, 2015, 37(7):1332-1338.]

[11]
Liao G T, He P, Gao X S, et al. The production-living-ecological land classification system and its characteristics in the hilly area of Sichuan Province, southwest China based on identification of the main functions[J]. Sustainability, 2019, 11(6):1600. DOI:10.3390/su11061600

DOI

[12]
逯承鹏, 纪薇, 刘志良, 等. 黄河流域甘肃段县域“三生”功能空间时空格局及影响因素识别[J]. 地理科学, 2022, 42(4):579-588.

DOI

[Lu C P, Ji W, Liu Z L, et al. Spatial-temporal pattern and influencing factors of the “Production-Living-Ecological” functional space of the Yellow River Basin at County level in Gansu, China[J]. Scientia Geographica Sinica, 2022, 42(4):579-588.] DOI:10.13249/j.cnki.sgs.2022.04.003

DOI

[13]
王成, 唐宁. 重庆市乡村三生空间功能耦合协调的时空特征与格局演化[J]. 地理研究, 2018, 37(6):1100-1114.

DOI

[Wang C, Tang N. Spatio-temporal characteristics and evolution of rural production-living-ecological space function coupling coordination in Chongqing Municipality[J]. Geographical Research, 2018, 37(6):1100-1114.] DOI:10.11821/dlyj201806004

DOI

[14]
冀正欣, 刘超, 许月卿, 等. 基于土地利用功能测度的“三生”空间识别与优化调控[J]. 农业工程学报, 2020, 36(18):222-231.

[Ji Z X, Liu C, Xu Y Q, et al. Identification and optimal regulation of the production-living-ecological space based on quantitative land use functions[J]. Transactions of the Chinese Society of Agricultural Engineering, 2020, 36(18):222-231.] DOI:10.11975/j.issn.1002-6819.2020.18.027

DOI

[15]
赵宏波, 魏甲晨, 孙东琪, 等. 基于随机森林模型的“生产-生活-生态”空间识别及时空演变分析——以郑州市为例[J]. 地理研究, 2021, 40(4):945-957.

DOI

[Zhao H B, Wei J C, Sun D Q, et al. Recognition and spatio-temporal evolution analysis of production-living-ecological spaces based on the random forest model: A case study of Zhengzhou City, China[J]. Geographical Research, 2021, 40(4):945-957.] DOI:10.11821/dlyj020200237

DOI

[16]
曹根榕, 顾朝林, 张乔扬. 基于POI数据的中心城区“三生空间”识别及格局分析——以上海市中心城区为例[J]. 城市规划学刊, 2019(2):44-53.

[Cao G R, Gu C L, Zhang Q Y. Recognition of “Ecological Space, Living Space, and Production Space” in the urban central area based on POI data: The case of Shanghai[J]. Urban Planning Forum, 2019(2):44-53.] DOI:10.16361/j.upf.201902005

DOI

[17]
Cao R, Zhu J S, Tu W, et al. Integrating aerial and street view images for urban land use classification[J]. Remote Sensing, 2018, 10(10):1553. DOI:10.3390/rs10101553.

DOI

[18]
Huang W M, Cui L Z, Chen M, et al. Estimating urban functional distributions with semantics preserved POI embedding[J]. International Journal of Geographical Information Science, 2022, 36(10):1905-1930. DOI:10.1080/13658816.2022.2040510

DOI

[19]
Zhang F, Zhou B L, Liu L, et al. Measuring human perceptions of a large-scale urban region using machine learning[J]. Landscape and Urban Planning, 2018, 180:148-160. DOI:10.1016/j.landurbplan.2018.08.020

DOI

[20]
Hu F, Liu W, Lu J Y, et al. Urban function as a new perspective for adaptive street quality assessment[J]. Sustainability, 2020, 12(4):1296. DOI:10.3390/su12041296.

DOI

[21]
Li X J, Zhang C R, Li W D. Building block level urban land-use information retrieval based on Google Street View images[J]. GIScience & Remote Sensing, 2017, 54(6):819-835. DOI:10.1080/15481603.2017.1338389

DOI

[22]
Srivastava S, Vargas Muñoz J E, Lobry S, et al. Fine-grained landuse characterization using ground-based pictures: A deep learning solution based on globally available data[J]. International Journal of Geographical Information Science, 2020, 34(6):1117-1136. DOI:10.1080/13658816.2018.1542698

DOI

[23]
Gong Z Y, Ma Q W, Kan C C, et al. Classifying street spaces with street view images for a spatial indicator of urban functions[J]. Sustainability, 2019, 11(22):6424. DOI:10.3390/su11226424

DOI

[24]
Fang F, Yu Y F, Li S W, et al. Synthesizing location semantics from street view images to improve urban land-use classification[J]. International Journal of Geographical Information Science, 2021, 35(9):1802-1825. DOI:10.1080/13658816.2020.1831515

DOI

[25]
张帆, 刘瑜. 街景影像——基于人工智能的方法与应用[J]. 遥感学报, 2021, 25(5):1043-1054.

[Zhang F, Liu Y. Street view imagery: Methods and applications based on artificial intelligence[J]. National Remote Sensing Bulletin, 2021, 25(5):1043-1054.] DOI:10.11834/jrs.20219341

DOI

[26]
Zhao H S, Shi J P, Qi X J, et al. Pyramid scene parsing network[C]. 2017 IEEE Conference on Computer Vision and Pattern Recognition (CVPR). IEEE, 2017:6230-6239. DOI:10.1109/CVPR.2017.660

DOI

[27]
Zhou B L, Zhao H, Puig X, et al. Semantic understanding of scenes through the ADE20K dataset[J]. International Journal of Computer Vision, 2019, 127(3):302-321. DOI:10.1007/s11263-018-1140-0

DOI

[28]
Ewing R, Cervero R. Travel and the built environment[J]. Journal of the American Planning Association, 2010, 76(3):265-294. DOI:10.1080/01944361003766766

DOI

[29]
Porta S, Renne J L. Linking urban design to sustainability: Formal indicators of social urban sustainability field research in Perth, Western Australia[J]. URBAN DESIGN International, 2005, 10(1):51-64. DOI:10.1057/palgrave.udi.9000136

DOI

[30]
Ye Y, Zeng W, Shen Q M, et al. The visual quality of streets: A human-centred continuous measurement based on machine learning algorithms and street view images[J]. Environment and Planning B: Urban Analytics and City Science, 2019, 46(8):1439-1457. DOI:10.1177/2399 808319828734

DOI

[31]
李建春, 起晓星, 袁文华. 基于POI数据的建设用地多功能混合利用空间分异研究[J]. 地理科学进展, 2022, 41(2):239-250.

DOI

[Li J C, Qi X X, Yuan W H. Spatial differentiation of multi-functional mixed use of construction land based on points of interest[J]. Progress in Geography, 2022, 41(2):239-250.] DOI:10.18306/dlkxjz.2022.02.005

DOI

[32]
Chen T Q, Guestrin C. XGBoost: A scalable tree boosting system[C]. Proceedings of the 22nd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. San Francisco, California, USA. New York: ACM, 2016:785-794. DOI:10.1145/2939672.2939785

DOI

[33]
Islam M D, Islam K S, Ahasan R, et al. A data-driven machine learning-based approach for urban land cover change modeling: A case of Khulna City Corporation area[J]. Remote Sensing Applications: Society and Environment, 2021, 24:100634. DOI:10.1016/j.rsase.2021.100634

DOI

[34]
Wong P Y, Hsu C Y, Wu J Y, et al. Incorporating land-use regression into machine learning algorithms in estimating the spatial-temporal variation of carbon monoxide in Taiwan[J]. Environmental Modelling & Software, 2021, 139:104996. DOI:10.1016/j.envsoft.2021.104996

DOI

[35]
Peng Z, Huang Q, Han Y C. Model research on forecast of second-hand house price in Chengdu based on XGboost algorithm[C]. 2019 IEEE 11th International Conference on Advanced Infocomm Technology (ICAIT). IEEE, 2019:168-172. DOI:10.1109/ICAIT.2019.8935894

DOI

[36]
Lundberg S M, Lee S I. A unified approach to interpreting model predictions[C]. Proceedings of the 31st International Conference on Neural Information Processing Systems. Long Beach, CA, USA, 2017:4768-4777

[37]
成都市人民政府. 成都概况[EB/OL]. http://www.che ngdu.gov.cn/chengdu/rscd/index.shtml, n.d, 2022-07-15.

[The official website of Chengdu Municipal People’s Government. Chengdu overview[EB/OL]. http://www.chengdu.gov.cn/chengdu/rscd/index.shtml, n.d, 2022-07-15.]

[38]
Chang S Z, Wang Z M, Mao D H, et al. Mapping the essential urban land use in Changchun by applying random forest and multi-source geospatial data[J]. Remote Sensing, 2020, 12(15):2488. DOI:10.3390/rs12152488

DOI

[39]
Ki D, Lee S. Analyzing the effects of Green View Index of neighborhood streets on walking time using Google Street View and deep learning[J]. Landscape and Urban Planning, 2021, 205:103920. DOI:10.1016/j.landurbplan.2020.103920

DOI

[40]
Wu C, Du Y H, Li S, et al. Does visual contact with green space impact housing prices? An integrated approach of machine learning and hedonic modeling based on the perception of green space[J]. Land Use Policy, 2022, 115:106048. DOI:10.1016/j.landusepol.2022.106048

DOI

[41]
Miller H J, Shaw S L. Geographic information systems for transportation: principles and applications[M]. New York: Oxford University Press, 2001

[42]
Yuan N J, Zheng Y, Xie X. Segmentation of urban areas using road networks[R]. Albuquerque, NM, USA: Microsoft, 2012: MSR-TR-2012-65.

Outlines

/