环境与健康

基于街景图像的可解释性城市感知模型研究方法

  • 刘智谦 , 1 ,
  • 吕建军 1 ,
  • 姚尧 , 1, 2, * ,
  • 张嘉琪 1 ,
  • 寇世浩 1 ,
  • 关庆锋 1
展开
  • 1.中国地质大学(武汉)地理与信息工程学院,武汉 430078
  • 2.阿里巴巴集团,杭州 311121
*姚尧(1987— ),男,广东梅州人,博士,副教授,研究方向为空间大数据和城市计算。E-mail:

刘智谦(1997— ),男,四川达州人,硕士生,研究方向为城市计算和空间分析。E-mail:

收稿日期: 2021-11-05

  修回日期: 2022-01-20

  网络出版日期: 2022-12-25

基金资助

国家自然科学基金项目(41671408)

国家自然科学基金项目(41901332)

国家重点研发计划项目(2019YFB2102903)

湖北省自然科学基金项目(2017CFA041)

Research Method of Interpretable Urban Perception Model based on Street View Imagery

  • LIU Zhiqian , 1 ,
  • LV Jianjun 1 ,
  • YAO Yao , 1, 2, * ,
  • ZHANG Jiaqi 1 ,
  • KOU Shihao 1 ,
  • GUAN Qingfeng 1
Expand
  • 1. School of Geography and Information Engineering, China University of Geosciences, Wuhan 430078, China
  • 2. Alibaba Group, Hangzhou 311121, China
*YAO Yao, E-mail:

Received date: 2021-11-05

  Revised date: 2022-01-20

  Online published: 2022-12-25

Supported by

National Natural Science Foundation of China(41671408)

National Natural Science Foundation of China(41901332)

National Key Research and Development Program of China(2019YFB2102903)

Natural Science Fund of Hubei Province(2017CFA041)

摘要

理解城市环境对人类感知的影响,对城市合理规划及布局具有重要的人文参考价值。城市环境是一个动态变化的复杂系统,具有空间异质性的特点。由于研究方法的限制,在复杂的城市环境中,以往基于街景图像的城市感知研究难以全面精细地分析环境关键要素对人类感知的影响。本研究以武汉市中心为研究区,首先利用全卷积神经网络将街景图像分割为城市地物类型,耦合感知打分数据和随机森林算法建立6类城市感知模型;然后基于沙普利值方法分解在随机森林模型中各类城市地物对人类感知的影响,并识别城市环境关键要素;最后结合分解结果,探究在非线性模型中沙普利值方法的适用性和优势。结果表明:沙普利值方法能够有效考虑环境异质性,精确地定量表示在不同场景中各类地物对人类感知的影响;城市高楼、天空、绿地空间是对人类感知影响最大的3类地物,且地物的体积和分布与其对人类感知的影响有关,图像占比大、分布连续的地物对人类感知的影响比图像占比小、分布离散的地物对人类感知的影响大;受城市环境空间异质性的影响,主要地物类型对各类感知的影响程度和形式有显著不同;高楼与人类感知为非线性关系,且具有明显的单调递增或递减的形式;绿地空间与积极感知呈非线性关系,与消极感知呈线性递减的关系。基于可解释性方法,本研究主要分析城市环境关键要素对人类感知的影响特点,探究了城市感知模型中的可解释性问题,能够为城市感知相关研究提供方法参考和理论依据,同时也可为城市规划和景观设计提供参考。

本文引用格式

刘智谦 , 吕建军 , 姚尧 , 张嘉琪 , 寇世浩 , 关庆锋 . 基于街景图像的可解释性城市感知模型研究方法[J]. 地球信息科学学报, 2022 , 24(10) : 2045 -2057 . DOI: 10.12082/dqxxkx.2022.210712

Abstract

Understanding the impact of urban environment on human perception has important humanistic reference value for rational urban planning and layout. The urban environment is a dynamic and complex system with spatial heterogeneity. Due to the limitations of research methods in the complex urban environment, it is difficult to analyze the impact of key elements of the environment on human perception comprehensively and precisely in previous urban perception studies based on street view images. In this study, the center of Wuhan is chosen as the research area. First, the street view images are segmented into urban ground objects by using Fully Convolutional Networks, coupled with perception scoring data and Random Forests algorithm to establish six types of urban perception models. Then, based on the Shapley value method, the impact of various urban ground objects on human perception in the forest model is decomposed, and the key elements of the urban environment are identified. Finally, combined with the decomposition results, the applicability and advantages of the Shapley value method in the nonlinear model are explored. The results show that the Shapley value method can effectively consider the spatial heterogeneity of urban physical environment and accurately and quantitatively express the impact of various ground objects on human perception in different scenarios. Urban buildings, sky, and green space are the three categories that have the greatest degree of impact on human perception. And the volume and distribution form of ground objects affects human intuitive visual experience of ground objects, which in turn affects the specific impact role of ground objects on human perception. The larger the image proportion of the ground objects or the more continuous the distribution of the ground objects, the greater the impact of ground objects on human perception. At the same time, because of the influence of the spatial heterogeneity of the urban physical environment, the impact degree and form of the main ground object types on various perceptions are significantly different. The relationship between buildings and human perception is nonlinear and has an obvious monotonically increasing or decreasing form. Green space has a nonlinear relationship with positive perception and a linear decreasing relationship with negative perception. Based on the interpretability approach, this study analyzes the impact of key elements of urban environment on human perception and explores the interpretability issues in urban perception models, which can provide methodological reference and theoretical basis for urban perception related research, as well as reference for urban planning and landscape design.

1 引言

人与环境关系一直是地理学研究的一个核心问题,是人类社会及其活动与地理环境交互的结果[1]。城市环境作为人类居住的基本场所和生活的基本条件,能够影响人类活动[2],也是评价人与环境关系的重要切入点之一。城市物理环境中的街道绿化情况、空气质量、噪声水平等方面影响人类对城市环境的主观感受。而城市的视觉外观在影响人类对城市环境的感知方面起着核心作用[2]。城市感知,即居民对城市视觉环境的心理感受[3],是探索人与城市环境关系的重要研究视角[4]。自Lynch在城市环境的开创性研究以来,已有学者基于城市感知的角度研究了居民对城市各类场景的心理感受[5]。城市感知为理解城市环境与公共心理相互作用的方式提供了重要基础[6],城市感知研究的发展也为城市规划及布局提供了重要的人文参考。
受限于数据获取的手段,传统的城市感知评估大多以问卷调查形式展开,在这些研究中志愿者被要求对街道或社区图像进行等级评分[5]。但采用调查的方式需要昂贵的人力资源,且缺乏时效性[7-8]。在最近十年里,新兴的街景图像为城市研究提供了丰富的数据[8-10]。街景数据是沿着街道拍摄的自然图像和照片,密集地覆盖了城市街道网络,提供关于城市物理环境的详细视觉信息[11]。它不仅能以人类视角反映日常生活的城市视觉风景,而且具备获取时间快、数据规模大的特点,能与快速发展的深度学习技术相结合,为城市感知研究提供新的机遇[6,8]。前人基于街景大数据从不同角度评估人类对城市物理环境的主观感受,包括道路安全性、可步行性、街道空间品质等[2,12],并取得了积极成果。这些研究说明了通过街景图像来反映城市物理环境对人类活动及心理状态的影响是有效的。在城市感知方面,很多学者已证实了基于卷积神经网络(Convolutional Neural Networks, CNN)模型和街景数据在城市感知研究中的有效性[4,9,13]。Yao等[6]基于腾讯地图采集和构建国内街景数据集,耦合全卷积神经网络(Fully Convolutional Networks, FCN)和随机森林(Random Forests, RF)模型提出了一种快速的城市感知评估方法。这种方法已在后续的研究中得到良好的应用和发展[8,13-14]
基于街景大数据,城市环境与人类感知的关系得到广泛的讨论。目前研究多利用线性模型来定量分析城市环境与城市感知的关系:如Zhang等[4]采用多元线性回归解释城市自然元素(如天空、草木等)对积极感知的调动作用,Helbich等[15]和Wang等[16]都利用多层线性回归解释城市蓝绿空间(如河流、树木等)对消极感知的抑制作用,以及街道绿化与心理健康的正相关关系。线性模型往往需要假定数据的分布形式或进行统计检验,这一定程度上限制了其反映真实关系的能力。但城市环境与人类情感存在复杂的关系[17-19],二者是否存在非线性关系仍需要进一步探索。
机器学习方法通常不会假定数据满足某种分布,具有更高的灵活性,被认为更擅长处理数据中的非线性关系[20]。尽管机器学习与街景图像的结合在城市感知建模中表现出优越的性能,但机器学习方法的弱解释问题却是限制其可信度和辅助决策的一大障碍[21-23]。理解机器学习为什么能在城市感知领域取得优异的成果,这需要对模型反映出的数据中的关联关系进行深入挖掘,这也是利用机器学习方法探索城市环境与人类感知交互关系的关键。近年来,可解释性是机器学习领域的一个快速发展的领域[24],目前可解释方法主要分为内在解释方法和建模后解释方法[25]。内在解释方法可以解释数据中哪些关系已被学习,但只能应用于简单透明的模型(如线性模型)[25]。但如前文所述,线性模型无法有效处理城市环境与人类感知间的复杂关系,因此利用建模后解释方法来解决机器学习在感知模型复杂性与可解释性之间的冲突是值得探索的一条路径。在经典沙普利值的基础上,Lundberg等[27]提出的SHAP(SHapley Additive exPlanation)解释方法,凭借优越的解释能力和与人类直觉保持一致的特点,在解释自然和社会经济相关机器学习模型中逐渐流行[28-29]。目前已有学者将SHAP引入到城市相关研究中,如Chen等[28]用其探讨房价与城市环境要素的关系,Parsa等[30]用其研究交通相关特征与交通事故发生的联系,Yu等[29]用其解释各类景观指数对城市地表温度的影响。
针对线性模型解释城市环境与人类感知关系的不足,本研究采用FCN方法提取街景图像中地物类型及其占比值,结合志愿者6种感知打分数据,并基于随机森林算法构建一个有效的城市感知评估模型。然后引入SHAP方法挖掘城市环境对人类感知的影响,理解感知模型的潜在机制,确定城市环境要素的关键变量及其影响强度和形式。

2 研究区概况与数据来源

2.1 研究区概况和数据来源

武汉市是我国中部地区最大的城市,其城区建筑密集且类型复杂[31]。本研究以武汉市中心城区为研究区域,共包括8个行政区:东西湖区、硚口区、江岸区、江汉区、汉阳区、青山区、武昌区、洪山区。本文所使用数据集概述如表1,具体描述如下:街景图像数据集是通过在研究区内主要道路上每隔100 m生成采样点,并在采样点上以人类水平视角环视一周(0°、90°、180°、270°)获取4幅图像,在研究区内共得到24 845个采样点,99 380幅街景图像。道路数据来自于OpenStreetMap( https://www.openstreetmap.org),基本覆盖了武汉市中心范围。本研究使用了Yao等人[6]构建的武汉感知数据集,其中每张图像由具有当地社会经济背景的志愿者对6种感知类型打分(美丽、无聊、沮丧、活泼、安全和富裕)[4,6,8]图1)。
表1 数据集概述

Tab. 1 Dateset summarizes

名称 类型 来源
街景图像数据集 图像数据 通过腾讯地图API获取
感知打分数据集 表格型 由志愿者人工评判街景图像所得
城市地物类型数据集 表格型 通过FCN-8s方法对街景图像进行语义分割所得
图1 武汉市人类感知打分数据

注:图中包括6个感知类型(美丽、无聊、沮丧、活泼、安全、富裕),分值范围为0~100分,其中0分表示人对相应的感知最弱,100分表示人对相应的感知最强。

Fig. 1 Scores data of emotional perception in Wuhan

2.2 地物类型数据

借助Yao等[6]获取街景图像特征的方法,本文将所有街景图像分割为151种地物类型,并计算出地物在图像中的占比值。在此基础上,根据前人研究中出现的代表性地物[4,6]和街景图像中出现次数最频繁的地物,本研究选取了以下14种地物类型(表2),构成武汉城市地物数据集。
表2 14种地物类型及其图像数据汇总统计

Tab. 2 Summary statistics of imagery data for fourteen kinds of ground objects

地物类别 地物中文名称 出现次数/% 占比均值/%
自然地物 77.714 1.428
植物 80.101 1.547
天空 99.936 29.180
98.865 14.207
人工地物 围栏 90.553 1.294
地面 77.883 1.624
指示物 56.249 0.060
人行道 92.127 2.614
广告牌 84.955 0.337
路灯 69.736 0.046
道路 99.545 18.430
机动汽车 90.223 2.553
91.250 2.042
高楼建筑 98.929 14.951

3 研究方法

本文的总体技术流程如图2。共包括以下步骤:① 利用FCN模型对城市街景图像进行地物分类,计算地物的图像占比值;② 结合感知打分数据和地物类型数据构建随机森林回归模型;③ 基于SHAP方法解释随机森林模型中各地物对人类感知的定量影响。
图2 本文研究框架

Fig. 2 Study framework of this paper

3.1 全卷积网络和随机森林

本文基于Yao等[6]提出的全卷积神经网络(FCN)和随机森林(RF)模型进行城市感知建模。本文采用了FCN-8s结构(图3),该模型通过多次跨层连接方式将底层卷积所提取的位置信息和高层卷积所提取的语义信息进行特征融合,以此提升语义分割性能,最终产生城市地物分割结果[13]。RF采用bootstrap有放回采样的方式选取若干个子集,并在子集上构造决策树[32]。对于回归任务,RF最终输出所有决策树的预测值的平均值。经FCN提取出的地物类型及其图像占比值数据集进行特征筛选后,本文将14种地物类型和感知得分用于RF回归建模。
图3 FCN-8s网络结构

Fig. 3 The network structure of FCN-8s

3.2 随机森林模型评价

为了反映感知模型的精度水平,本文采用3种精度评价指标,分别为:拟合优度( S t a n d a r d R 2)、均方根误差( R M S E)和平均绝对误差( M A E)。计算公式如下:
S t a n d a r d R 2 = 1 - i = 1 n ( y ^ i - y i ) 2 i = 1 n ( y - - y i ) 2
R M S E = 1 n i = 1 n ( y i - y ^ i ) 2
M A E = 1 n i = 1 n ( y i - y ^ i )
式中: y ^ i, y i分别表示第i个样本的RF模型预测和真实值; y -表示所有样本真实值的平均值;n为样本总数。

3.3 基于SHAP的特征分析方法

SHAP方法是一种局部性的机器学习特征分析方法,继承于联合博弈论中Shapley值概念,即沙普利值方法[27]。在本文中,SHAP方法根据各类城市地物对人类感知的贡献来为地物分配SHAP值。SHAP方法首先通过数据分布和模型被解释变量计算出一个基准值 ϕ 0(通常近似于模型被解释变量的平均值),随后将模型的被解释变量分解为基准值和特征的SHAP值,如式(4)[27]。该式可理解为场景的感知分数是由基准值和地物的SHAP值线性相加得到。
g ( z ' ) = ϕ 0 + i = 1 M ϕ i z i '
式中: z i ' { 0,1 } M表示第i个地物特征是否参与模型预测; M表示感知模型中的特征数量; ϕ i表示第i个地物特征的影响值。
SHAP值计算公式[27]如下:
ϕ i = S F \ { i } S ! F - S - 1 ! F ! f S { i } ( x S { i } ) - f S ( x S )
式中: ϕ i表示第i个地物特征的SHAP值; S表示参与预测的特征集合; F表示所有特征集合; f表示感知模型。在本文中SHAP值计算可以理解为:在考虑城市地物不同比例组合下,对不同场景的感知分数之差进行加权求和。式(4)保证了SHAP值计算的局部精确性,式(5)则保证了SHAP值分配的公平性[33]。SHAP值表示地物对人类感知的直接影响程度,绝对值越大影响程度越高,而其正负性表示地物对人类感知的促进或抑制作用。
与回归系数、随机森林特征重要性等全局性方法相比,SHAP方法的局部性特点正适应城市环境的空间变化,为感知模型提供更加精细的特征贡献对比数据。同时,SHAP方法不依赖任何模型内部知识,直接观察特征和被解释变量的组合和分布情况来评估特征对被解释变量的正负影响,这意味着模型的改变不影响特征的相对SHAP值。SHAP值更能反映数据分布中的规律和模型预测行为。本文将建立的6个感知模型和地物特征数据输入到SHAP算法中,用SHAP值来定量表示城市地物对人类感知的影响。

4 结果与分析

4.1 感知模型的精度评价

本文以街景图像中14个代表地物为自变量, 6种感知得分分别为因变量,构建基于随机森林的 6个城市感知模型。将24 845个地物类别样本与 6类感知得分分别对应后,形成6类地物-感知数据集,将6类数据分别随机划分为70%的训练集和30%的测试集,分别经过训练后进行精度评价。 表3展示了测试集中6种感知模型的精度。可以发现在3种精度指标下模型表现都很优秀,平均R2为0.932。这说明我们的模型能够很好地拟合数据,在预测过程中不会产生过大偏差。因此在这6个模型基础上,可利用SHAP方法理解城市地物对人类感知的影响。
表3 6种感知模型的拟合精度

Tab. 3 Fitting accuracy of six emotion perception models

感知类型 R2 RMSE MAE
美丽 0.925 2.807 2.073
无聊 0.855 2.310 1.746
沮丧 0.974 1.680 1.258
活泼 0.935 3.320 2.491
安全 0.947 2.518 1.900
富裕 0.953 2.490 1.852

4.2 地物对城市感知影响的总体分析

图4结果表明高楼、天空、树是城市内部空间中对人类感知影响程度最高的3类地物,特别是高楼对6类感知的平均绝对影响达到4.210,远远高于其他地物类型。这一结果与Yao等[6]用随机森林特征重要性方法发现的结果类似。一方面,得到的结果与数据集有关,本次实验所用原始数据集是武汉中心地区的街景图像,该地区高楼密集;另一方面,高楼与城市居民日常生活息息相关,高楼的布局、风格等因素会对人类感知产生一定影响。
图4 地物对6类感知的影响总览

Fig. 4 The general overview of the effect of ground objects on six types of emotion

图4(a)—(c)中,绿地空间,如树、草地等在街景图片中占比大,不仅对美丽感知的正影响更高,而且可以减轻无聊、沮丧的感知。这表明城市绿地空间一方面对美丽等积极感知有正向作用,另一方面对无聊、沮丧等消极感知有抑制作用,这与前人发现相一致[34-36]。同时天空对美丽和沮丧感知也有相似的影响作用。
图4((d)、(f))中,人造地物,如高楼、机动车辆、道路等对活泼、富裕感知的影响具有相似性。人造地物在图像中占比高对活泼、富裕感知呈正影响,在图像中占比低则对两种感知呈负影响。这可能由于更多的高楼、机动车辆和道路地物占比意味着附近有着更为发达的交通、更高的人口密度,对活泼、富裕感知有更积极的调动作用,同时也增强了人类的安全感。图4(e)则反映出部分自然和人造地物,如天空、地面、墙等会对人的安全感受产生一定负影响,高图像占比的这些地物意味开阔的地理环境、较低的人口密度,这些联系会降低人对当前环境的安全感受[37-38]
人行道、围栏、广告牌、街灯、指示物的SHAP值值域范围小,绝对SHAP平均值也很低,对人类感知影响程度很小。这主要是由于它们自身体积较小,在人类视觉和日常街景图像中难以充当主要地物,且它们的功能单一、样式变化简单,因此对人类日常感知的影响较小。结果反映出城市公共空间中各个地物对六类感知影响的差异显著。图像占比大、分布连续的地物类型,如高楼、天空等,对人类日常感知总体影响大,但会随不同感知呈现不同的正负影响形式。图像占比小、分布不连续的地物类型,如指示牌、街灯等,对人类日常感知总体影响很小且不会因感知的不同出现较大的变化。

4.3 典型地物对感知的非线性影响

本研究中,高楼是对人类感知影响最大的地物,而前人研究中城市绿地对人类感知的精细影响仍不明确。因此我们选择高楼和城市绿地空间对感知的影响变化进行详细分析。图5展示了高楼对美丽感知的影响,二者关系类似于反比例函数关系,即高楼占比值低对美丽感知有着很强的推动作用,最高影响可达到10以上。而随着高楼占比值的不断增加,高楼对美丽感知的影响逐渐降低,最后对美丽感知产生较强负作用。高楼与其对沮丧、活泼、安全、富裕感知的影响都类似于对数函数关系。占比值较低的高楼类型减少了这4种感知的 得分,随着高楼在环境中的占比上升,一方面高密度的建筑分布加重了人类的沮丧感知,另一方面高楼的增多调动了活泼、安全、富裕感知。以上结果拓展了Zhang等[4]发现的建筑与人类感知的线性关系。
图5 高楼在图像中占比值与其对应SHAP值的变化情况

Fig. 5 The variation of the percentage values of buildings in the figure with its corresponding SHAP values.

本文选取了对6类感知平均影响更大的树作为城市绿地的代表进行分析。从图6(a)—(c)中可以发现,树对美丽感知的影响呈现非线性的形式,对无聊和沮丧感知近似于线性递减的形式,特别是对沮丧感知的影响。从SHAP值值域范围看,在某些情况下城市绿地空间对消极感知的压制作用会大于对积极感知的调动作用。从图6(d)—(f)中的纵坐标可以发现树地物的SHAP值值域范围较小,反映城市绿地空间对活泼、安全、富裕感知的影响程度较低,同时图中也未反映出较明显的变化特点。与前人在线性模型下发现的绿地对人类感知的平均影响作用相比,本文更加精确地反映了在城市场景中不同数量的绿地对人类感知的不同影响。
图6 树在图像中占比值与其SHAP值的变化情况

Fig. 6 The variation of the percentage values of tree in the figure with its corresponding SHAP values.

比较图5(a)、(c)和图6(a)、(c)中高楼、绿地分别对美丽、沮丧感知的影响走势,可以发现两种地物类型对两种对立感知的影响呈现强烈的相反形式。一方面这是由于街景图像中高楼和绿地有一定程度的冲突关系。另一方面高楼属于人造地物,绿地更接近或属于自然场景,这两者在对人类感知影响具有显著差异[39]

5 讨论

本文通过SHAP方法构建了有效的可解释随机森林模型,识别了城市环境中的关键要素,并通过SHAP值分析了在城市环境空间异质性下各关键要素对人类感知的影响作用。本文的可解释性优势主要有以下几点:① SHAP方法通过比较不同视觉环境下感知分数的差异来衡量城市地物特征对人类感知的影响,为每个样本的所有特征赋予了独特的SHAP值;② SHAP方法充分考虑了城市地物随场景变化而变化的特点,为解释感知模型中的非线性关系提供了易于理解的特征重要性和特征影响方向的量化数值; ③ SHAP方法补足了本文的模型在模型可解释性方面的不足,使得模型在精度与解释性达到了统一。从结果来看,高楼、天空、绿地是对人类感知影响最大的城市地物,这表现出与前人研究的一致性[4,6]。此外本文还发现高楼、绿地与人类感知存在明显的非线性关系,探讨了其非线性关系的具体形式,补足了城市环境与人类感知复杂关系研究的工作。因为考虑到了城市地物在空间中的不同组成和不同图像占比值,本文还发现:在图像中占比大,分布连续的地物对感知的影响程度往往比图像占比小、分布离散的地物对感知的影响程度更高。已有研究说明城市绿地空间对人类积极感知的正向作用[40-42],本文不仅再次证实了城市绿地对积极感知的正向作用,而且进一步量化了不同视觉环境中绿地对人类美丽感知的影响程度,发现绿地对美丽感知的促进作用大于对沮丧感知的抑制作用。综上,本研究采用的FCN-RF-SHAP方法有效解决了线性模型对城市环境与人类感知复杂关系解释不足的问题。
本文还存在以下几点城市规划启示:
(1)在新城区建设中增加连续且覆盖广的绿色空间,在旧城区改造中以碎片化形式来增加绿地规模,提高市民接触绿地的机会;
(2)人造地物和绿地的配置应根据规划区的社会服务属性来调整,如商业区可增加高楼建筑规模,以强化市民对其的安全和富裕感知;
(3)高层建筑与低层建筑应合理布局、错落有致,增强其在市民日常视域中的立体感,避免出现大量天空留白或仅有稀疏的天空可见。
城市环境不仅包括街景视觉,还包括场景的温度、噪声等相关要素。因此,未来可融合多种数据来增强城市感知模型的可解释性。同时已有文献指出中国城市的街道景观非常复杂[6],研究区的城市环境存在一定的空间异质性。后续可进一步优化街景数据采样区的划分,提高数据源覆盖范围,挖掘城市环境对感知影响的空间分异特征及相关影响因素。

6 结论

准确定量描述城市环境要素对人类感知的影响作用对于理解人与城市环境的复杂关系具有重要意义。本文以武汉市中心为例,基于街景图像数据,通过FCN方法有效识别了街景图像中城市地物类型,并结合感知得分数据构建了6类感知评估模型,进一步结合SHAP方法识别出了城市环境的关键要素,并分析其与人类感知间的复杂关系。本文的主要结论如下:
(1)SHAP方法既与回归系数、随机森林特征重要性方法表现出相当的一致性,又能适应城市环境空间异质性发现不同环境下城市地物对人类感知的细致影响,这可为拓展城市环境与人类感知关系的理论提供丰富的数据基础,也可为城市感知研究领域提供方法参考。
(2)高楼、天空、绿地是对人类感知影响最大的城市地物。但随着城市空间的局部环境的变化,它们对人类感知的具体影响作用会有较大的差异。并且随着感知类型的不同,它们对各类感知的影响作用也有很大的差异。这一点在人造地物与自然地物上反映尤为明显。同时地物在场景中的体积和分布形式与地物对人类感知的影响有关,即在图像中占比大,分布连续的地物对感知的影响程度往往比图像占比小、分布离散的地物对感知的影响程度更高。
(3)在城市环境关键要素中,高楼与各种感知呈明显的非线性关系,且具有明显的单调递增或递减的形式,而绿地与人类感知存在较复杂的非线性关系。这为城市环境与人类感知存在非线性关系提供实证,丰富了城市环境与人类情感研究的理论成果。
[1]
Huang Y, Fei T, Kwan M P, et al. GIS-Based emotional computing: A review of quantitative approaches to measure the emotion layer of human-environment relationships[J]. ISPRS International Journal of Geo-information, 2020, 9(9):551. DOI: 10.3390/ijgi9090551

DOI

[2]
张丽英, 裴韬, 陈宜金, 等. 基于街景图像的城市环境评价研究综述[J]. 地球信息科学学报, 2019, 21(1):46-58.

DOI

[ Zhang L Y, Pei T, Chen Y J, et al. A review of urban environment assessment based on street view images[J]. Journal of Geo-information Science, 2019, 21(1):46-58. ] DOI: 10. 12082/dqxxkx.2019.180311

DOI

[3]
Weber R, Schnier J, Jacobsen T. Aesthetics of streetscapes: influence of fundamental properties on aesthetic judgments of urban space[J]. Perceptual and Motor Skills, 2008, 106(1):128-146. DOI: 10.2466/pms.106.1.128-146

DOI PMID

[4]
Zhang F, Zhou B, Liu L, et al. Measuring human perceptions of a large-scale urban region using machine learning[J]. Landscape and Urban Planning, 2018, 180:148-160. DOI: 10.1016/j.landurbplan.2018.08.020

DOI

[5]
Porzi L, Rota Bulò S, Lepri B, et al. Predicting and understanding urban perception with convolutional neural networks[C]. Proceedings of the 23rd ACM international conference on Multimedia, 2015:139-148. DOI: 10.1145/2733373.2806273

DOI

[6]
Yao Y, Liang Z, Yuan Z, et al. A human-machine adversarial scoring framework for urban perception assessment using street-view images[J]. International Journal of Geographical Information Science, 2019, 33(12):2363-2384. DOI: 10.1080/13658816.2019.164.3024

DOI

[7]
Kang Y, Jia Q, Gao S, et al. Extracting human emotions at different places based on facial expressions and spatial clustering analysis[J]. Transactions in GIS, 2019, 23(3):450-480. DOI: 10.1111/tgis.12552

DOI

[8]
Wang R, Liu Y, Lu Y, et al. Perceptions of built environment and health outcomes for older Chinese in Beijing: A big data approach with street view images and deep learning technique[J]. Computers, Environment and Urban Systems, 2019, 78:101386. DOI: 10.1016/j.compenvurbsy s.2019.101386

DOI

[9]
Dubey A, Naik N, Parikh D, et al. Deep learning the city: quantifying urban perception at a global scale[C]. European Conference on Computer Vision. Springer, Cham, 2016:196-212. DOI: 10.1007/978-3-319-46448-0_12

DOI

[10]
Anguelov D, Dulong C, Filip D, et al. Google street view: capturing the world at street level[J]. Computer, 2010, 43(6):32-38. DOI: 10.1109/MC.2010.170

DOI

[11]
Zhang F, Zu J, Hu M, et al. Uncovering inconspicuous places using social media check-ins and street view images[J]. Computers, Environment and Urban Systems, 2020, 81:101478. DOI: 10.1016/j.compenvurbsys.2020.101478

DOI

[12]
崔成, 任红艳, 赵璐, 等. 基于街景影像多特征融合的广州市越秀区街道空间品质评估[J]. 地球信息科学学报, 2020, 22(6):1330-1338.

DOI

[ Cui C, Ren H Y, Zhao L, et al. Street space quality evaluation in Yuexiu district of Guangzhou city based on multi-feature fusion of street view[J]. Journal of Geo-information Science, 2020, 22(6):1330-1338. ] DOI: 10.12082/dqxxkx.2020.200072

DOI

[13]
Wang R, Ren S, Zhang J, et al. A comparison of two deep-learning-based urban perception models: Which one is better?[J]. Computational Urban Science, 2021, 1(1):1-13. DOI: 10.6084/m9.figshare.12552233

DOI

[14]
Wang R, Yuan Y, Liu Y, et al. Using street view data and machine learning to assess how perception of neighborhood safety influences urban residents' mental health[J]. Health & Place, 2019, 59:102186. DOI: 10.1016/j.healthplace.2019.102186

DOI

[15]
Helbich M, Yao Y, Liu Y, et al. Using deep learning to examine street view green and blue spaces and their associations with geriatric depression in Beijing, China[J]. Environment International, 2019, 126:107-117. DOI: 10.1016/j.envint.2019.02.013

DOI PMID

[16]
Wang R, Helbich M, Yao Y, et al. Urban greenery and mental wellbeing in adults: Cross-sectional mediation analyses on multiple pathways across different greenery measures[J]. Environmental Research, 2019, 176:108535. DOI: 10.1016/j.envres.2019.108535

DOI

[17]
Evans G W. The built environment and mental health[J]. Journal of Urban Health, 2003, 80(4):536-555. DOI: 10. 1093/jurban/jtg063

DOI

[18]
Lee A C, Maheswaran R. The health benefits of urban green spaces: a review of the evidence[J]. Journal of Public Health, 2011, 33(2):212-222. DOI: 10.1093/pubmed/fdq068

DOI

[19]
Li X, Hijazi I, Koenig R, et al. Assessing essential qualities of urban space with emotional and visual data based on GIS technique[J]. ISPRS International Journal of Geo-Information, 2016, 5(11):218. DOI: 10.3390/ijgi5110218

DOI

[20]
陈逸敏, 黎夏. 机器学习在城市空间演化模拟中的应用与新趋势[J]. 武汉大学学报·信息科学版, 2020, 45(12):1884-1889.

[ Chen Y M, Li X. Application and new trends of machine learning in urban simulation research[J]. Geomatics and Information Science of Wuhan University, 2020, 45(12):1884-1889. ] DOI: 10.13203/j.whugis20 200423

DOI

[21]
Zhang Q, Zhu S. Visual interpretability for deep learning: a survey[J]. Frontiers of Information Technology & Electronic Engineering, 2018, 19(1):27-39. DOI: 10.1631/FITEE.1700808

DOI

[22]
Gilpin L H, Bau D, Yuan B Z, et al. Explaining explanations: an overview of interpretability of machine learning[C]. 2018 IEEE 5th International Conference on Data Science and Advanced Analytics (DSAA). IEEE, 2018: 80-89. DOI: 10.1109/DSAA.2018.00018

DOI

[23]
Carvalho D V, Pereira E M, Cardoso J S. Machine learning interpretability: a survey on methods and metrics[J]. Electronics, 2019, 8(8): 832. DOI:10.3390/electronics8080 832

[24]
Murdoch W J, Singh C, Kumbier K, et al. Definitions, methods, and applications in interpretable machine learning[J]. Proceedings of the National Academy of Sciences, 2019, 116(44):22071-22080. DOI: 10.1073/pnas.1900654116

DOI

[25]
Du M, Liu N, Hu X. Techniques for interpretable machine learning[J]. Communications of the ACM, 2019, 63(1):68-77. DOI: 10.1145/3359786

DOI

[26]
Cha Y K, Shin J, Go B G, et al. An interpretable machine learning method for supporting ecosystem management: application to species distribution models of freshwater macroinvertebrates[J]. Journal of Environmental Management, 2021, 291:112719. DOI: 10.1016/j.jenvman.2021.1 12719

DOI

[27]
Lundberg S M, Lee S. A unified approach to interpreting model predictions[C]. Proceedings of the 31st International Conference on Neural Information Processing Systems, 2017:4768-4777.

[28]
Chen L, Yao X, Liu Y, et al. Measuring impacts of urban environmental elements on housing prices based on multisource data-a case study of shanghai, china[J]. ISPRS International Journal of Geo-information, 2020, 9(2):106. DOI: 10.3390/ijgi9020106

DOI

[29]
Yu S, Chen Z, Yu B, et al. Exploring the relationship between 2D/3D landscape pattern and land surface temperature based on explainable eXtreme Gradient Boosting tree: A case study of Shanghai, China[J]. Science of the Total Environment, 2020, 725:138229. DOI: 10.1016/j.scitotenv.2020.138229

DOI

[30]
Parsa A B, Movahedi A, Taghipour H, et al. Toward safer highways, application of XGBoost and SHAP for real-time accident detection and feature analysis[J]. Accident Analysis & Prevention, 2020, 136:105405. DOI: 10.1016/j.aap.2019.105405

DOI

[31]
Li L, Li J, Jiang Z, et al. Methods of population spatialization based on the classification information of buildings from China's first national geoinformation survey in urban area: a case study of Wuchang district, Wuhan city, China[J]. Sensors, 2018, 18(8): 2558. DOI:10.3390/s1808 2558

DOI

[32]
Breiman L. Random forests[J]. Machine learning, 2001, 45(1):5-32. DOI: 10.1023/A:1010933404324

DOI

[33]
Lundberg S M, Erion G, Chen H, et al. From local explanations to global understanding with explainable AI for trees[J]. Nature Machine Intelligence, 2020, 2(1):56-67. DOI: 10.1038/s42256-019-0138-9

DOI PMID

[34]
Tyrväinen L, Ojala A, Korpela K, et al. The influence of urban green environments on stress relief measures: Afield experiment[J]. Journal of Environmental Psychology, 2014, 38:1-9. DOI: 10.1016/j.jenvp.2013.12.005

DOI

[35]
Twohig-Bennett C, Jones A. The health benefits of the great outdoors: A systematic review and meta-analysis of greenspace exposure and health outcomes[J]. Environmental Research, 2018, 166:628-637. DOI: 10.1016/j.env res.2018.06.030

DOI PMID

[36]
Roberts H, Sadler J, Chapman L. The value of Twitter data for determining the emotional responses of people to urban green spaces: A case study and critical evaluation[J]. Urban Studies, 2019, 56(4):818-835. DOI:10.117/004 2098017748544

DOI

[37]
Kuo F E, Bacaicoa M, Sullivan W C. Transforming inner-city landscapes: Trees, sense of safety, and preference[J]. Environment and Behavior, 1998, 30(1):28-59. DOI: 10. 1177/0013916598301002

DOI

[38]
He L, Páez A, Liu D. Built environment and violent crime: an environmental audit approach using google street view[J]. Computers, Environment and Urban Systems, 2017, 66:83-95. DOI: 10.1016/j.compenvurbsys.2017. 08.001

DOI

[39]
Ballew M T, Omoto A M. Absorption: how nature experiences promote awe and other positive emotions[J]. Ecopsychology, 2018, 10(1):26-35. DOI: 10.1089/eco.2017.0044

DOI

[40]
Ma B, Zhou T, Lei S, et al. Effects of urban green spaces on residents' well-being[J]. Environment, Development and Sustainability, 2019, 21(6):2793-2809. DOI: 10.1007/s10668-018-0161-8

DOI

[41]
McEwan K, Ferguson F J, Richardson M, et al. The good things in urban nature: A thematic framework for optimising urban planning for nature connectedness[J]. Landscape and Urban Planning, 2020, 194:103687. DOI: 10.1 016/j.landurbplan.2019.103687

DOI

[42]
Pouso S, Borja Á, Fleming L E, et al. Contact with blue-green spaces during the COVID-19 pandemic lockdown beneficial for mental health[J]. Science of the Total Environment, 2021, 756:143984. DOI: 10.1016/j.scitotenv.2020. 143984

DOI

文章导航

/