特征向量空间滤波方法在室外盗窃空间分析中的应用
贺 力(1987— ),男,陕西西安人,博士,副教授,博士生导师,主要从事犯罪地理、空间计量、社会计算研究。E-mail: lihegeo@xjtu.edu.cn |
Copy editor: 黄光玉
收稿日期: 2023-10-27
修回日期: 2023-12-11
网络出版日期: 2024-07-24
基金资助
国家自然科学基金项目(42001164)
国家自然科学基金项目(41901160)
教育部人文社会科学研究青年基金项目(20YJC840014)
国家社会科学基金重大项目(19ZDA149)
浙江省自然科学基金项目(LY23D010001)
Application of Eigenvector Spatial Filtering in Spatial Analysis of Larceny-theft
Received date: 2023-10-27
Revised date: 2023-12-11
Online published: 2024-07-24
Supported by
National Natural Science Foundation of China(42001164)
National Natural Science Foundation of China(41901160)
Humanities and Social Sciences Youth Fund Project of the Ministry of Education, China(20YJC840014)
Major Project of The National Social Science Fund of China(19ZDA149)
Zhejiang Provincial Natural Science Foundation of China under Grant(LY23D010001)
在犯罪空间分析和空间建模过程中,模型残差中的空间自相关问题对模型参数估计的准确度和犯罪相关因素的分析构成了极大的阻碍,模型残差存在显著空间自相关会导致模型的有偏估计及误导性的推断,甚至导致错误的研究结论。本研究采用一种较为新颖的空间统计方法,即特征向量空间滤波方法(Eigenvector Spatial Filtering),来消除犯罪回归模型估计过程中的残差自相关问题,以及由此引发的模型参数有偏估计问题。以此为基础,立足犯罪模式理论和社会解组理论,以浙江省海宁市主城区为研究区,采用2018年1月—2021年9月室外盗窃警情立案数据、海宁市建成环境数据、珞珈一号夜间灯光遥感数据以及WorldPop人口网格数据,在网格尺度上构建基于特征向量空间滤波的泊松回归模型,在消除模型残差自相关、纠正模型参数估计偏误的基础上,识别出海宁室外盗窃犯罪的影响因素。研究发现:① 基于特征向量空间滤波的泊松回归模型提取出了模型残差中的自相关部分,确保残差无显著空间自相关,将显著的空间滤波加入回归模型,较大幅度提升了模型拟合优度,纠正了系数估计偏误问题,缓解了过度离散问题,并找回了遗漏变量。该方法可推广至其他计数模型和广义线性回归分析场景中,有助于提升模型参数的准确估计水平,找回因自相关等原因而被遗漏的变量; ② 新兴时空热点分析显示,室外盗窃绝对数量随疫情到来呈递减趋势,室外盗窃热点持续于海宁市主城区中部,冷点呈多点分布;③ 人均夜间灯光所表征的城市相对剥夺水平对室外盗窃有显著正向影响;④ 由各类建成环境所刻画的犯罪吸引地、产生地、促成地对室外盗窃有显著影响,本文同时也对与以往研究结论不一致的地方进行了讨论。
贺力 , 何国喜 , 郑滋椀 . 特征向量空间滤波方法在室外盗窃空间分析中的应用[J]. 地球信息科学学报, 2024 , 26(8) : 1779 -1793 . DOI: 10.12082/dqxxkx.2024.230634
In spatial analysis and modeling of urban crime, the spatial autocorrelation of model residuals poses an significant obstacle to model parameter estimation and produces deviations in analysis of the determinants of urban crime. The presence of significant spatial autocorrelation of model residuals and overdispersion of the model could lead to biased estimates and misleading inferences, even resulting in wrong conclusions. This study employed a new spatial regression method, namely Poisson regression with Eigenvector Spatial Filtering, to solve the problem of model residual spatial autocorrelation and model overdispersion to avoid subsequent biased estimation in model results. To explain the spatial variation of urban crime, we used two theories in spatial crime analysis: crime pattern theory and social disorganization theory. The case study focused on the main urban area of the Haining city in Zhejiang province, China, and the crime data that we used were larceny-theft over a four-year period, from January 2018 to September 2021. Other datasets that we employed for generating covariates included POI data of various facilities in Haining, the Luojia 1-01 nighttime light data, and the WorldPop global population data. We established a Poisson regression model with eigenvector spatial filtering and further identified several important determinants of larceny-theft with unbiased model parameters. The major findings are as follows: (1) The Poisson regression with eigenvector spatial filtering identified the spatial autocorrelation of model residuals, ensuring no significant spatial autocorrelation issue in model residuals. This can improve the model's goodness of fit, correct model parameter estimation, alleviate the impact of overdispersion, and retrieve omitted variables. More importantly, the eigenvector spatial filtering method could be applied to other generalized linear models such as Poisson regression; (2) The results of Emerging Hot Spot Analysis showed that the absolute number of larceny-theft decreased during the period of COVID-19 pandemic, and crime hot spots occurred in the central places of the main urban area of Haining while the cold spots exhibited a trend of multipoint distribution; (3) The level of relative deprivation measured by per capita nighttime light had a significant impact on larceny-theft in the unbiased model with eigenvector spatial filtering; (4) The crime generator, attractor and enabler in various built environment of interest had a significant impact on larceny-theft. The inconsistencies with the conclusions of previous studies were also discussed.
表1 数据来源及预处理Tab. 1 Data source and data preprocessing |
变量类型 | 数据名称 | 来源 | 时间 | 类型 | 预处理 |
---|---|---|---|---|---|
被解释变量 | 室外盗窃 | 海宁公安 | 2018年1月—2021年9月 | 点状shp | 在800 m网格尺度做叠加分析 |
解释变量:建成环境 | POI | 高德地图 | 2018年 | 点状shp | 参照犯罪模式理论,分为犯罪产生地、吸引地和促成地;在800 m网格尺度 做叠加分析 |
解释变量:社会经济相对 剥夺(人均夜间灯光) | 夜间灯光 | 珞珈1号 | 2019年 | 130 m 130 m网格 | 重采样至141 m 141 m, 夜间灯光数据 除以人口数据 |
人口网格 | WorldPop | 2020年 | 100 m 100 m网格 |
表3 变量描述性分析(N=274)Tab. 3 Descriptive statistics for variables used in the analysis (N=274 observations) |
类型 | 编码 | 变量 | 均值 | 标准差 | 最小值 | 最大值 |
---|---|---|---|---|---|---|
因变量 | Y | 室外盗窃数量/个 | 11.18 | 25.77 | 0 | 217.00 |
犯罪吸引地 | X1 | 网吧、台球厅、酒吧、棋牌室、 洗浴中心、KTV数量* | -3.86 | 1.99 | -5 | 0.63 |
犯罪产生地 | X2 | 公交车站、地铁站、火车站数量/个 | 1.51 | 2.13 | 0 | 14.00 |
X3 | 便利店、超市、商场数量/个 | 4.54 | 10.01 | 0 | 80.00 | |
X4 | 餐厅数量* | -2.55 | 2.96 | -5 | 2.26 | |
犯罪促成地 | X5 | 大中小学数量* | -3.92 | 2.12 | -5 | 1.08 |
X6 | 公园和广场数量* | -4.46 | 1.56 | -5 | 0.30 | |
社会经济相对 剥夺水平变量 | X7 | 人均夜间灯光* | 2.37 | 1.20 | -5 | 3.74 |
注:*表示该类所有变量之和加0.000 01后取常用对数(即以10为底的对数)。 |
表4 变量相关性检验Tab. 4 Correlations between variables |
Y | X1 | X2 | X3 | X4 | X5 | X6 | X7 | |
---|---|---|---|---|---|---|---|---|
Y | 1 | |||||||
X1 | 0.532* | 1 | ||||||
X2 | 0.558* | 0.580* | 1 | |||||
X3 | 0.503* | 0.631* | 0.635* | 1 | ||||
X4 | 0.461* | 0.726* | 0.620* | 0.585* | 1 | |||
X5 | 0.434* | 0.491* | 0.541* | 0.416* | 0.506* | 1 | ||
X6 | 0.281* | 0.300* | 0.275* | 0.314* | 0.306* | 0.152* | 1 | |
X7 | 0.109 | 0.160* | 0.213* | 0.111 | 0.259* | 0.170* | 0.065 | 1 |
注:*表示p<0.05。 |
表5 基于特征向量空间滤波的泊松回归参数估计Tab. 5 Parameter estimates from the Poisson regression with eigenvector spatial filters |
类型 | 变量 | 模型1 | 模型2 | 模型3 | |||
---|---|---|---|---|---|---|---|
系数 | p值 | 系数 | p值 | 系数 | p值 | ||
常数项 | 3.20 | 0.000 | 2.89 | 0.000 | 0.96 | 0.017 | |
犯罪吸引地 | 网吧、台球厅、酒吧、棋牌室、洗浴中心、KTV数量* | 0.20 | 0.000 | 0.20 | 0.000 | 0.09 | 0.024 |
犯罪产生地 | 公交车站、地铁站、火车站数量/个 | 0.09 | 0.000 | 0.09 | 0.001 | 0.06 | 0.008 |
便利店、超市、商场数量/个 | - | - | - | - | -0.01 | 0.041 | |
餐厅数量* | 0.08 | 0.000 | 0.08 | 0.000 | 0.05 | 0.003 | |
犯罪促成地 | 大中小学数量* | 0.09 | 0.004 | 0.09 | 0.002 | 0.06 | 0.006 |
公园和广场数量* | 0.06 | 0.033 | 0.07 | 0.025 | - | - | |
社会经济相对 剥夺水平变量 | 人均夜间灯光* | - | - | - | - | 0.53 | 0.000 |
空间滤波(6个特征向量) | - | - | - | - | 1.00 | 0.000 | |
N/个 | 274 | 274 | 274 | ||||
Pseudo-R2 | 0.496 | 0.492 | 0.619 | ||||
残差Moran's I | 0.127 | 0.132 | -0.001 | ||||
残差Moran's I(Z得分) | 4.209 | 4.427 | 0.218 | ||||
过度离散参数(估计值) | 3.534 | 3.524 | 2.707 |
注:*表示该类所有变量之和加0.000 01后取常用对数(即以10为底的对数)。 |
[1] |
乔顺利. 我国盗窃案件规律特点的新发展与对策研究——以四地盗窃案件统计数据为样本的比较分析[J]. 政法学刊, 2020, 37(1):105-112.
[
|
[2] |
柳林, 姜超, 周素红, 等. 城市入室盗窃犯罪的多尺度时空格局分析——基于中国H市DP半岛的案例研究[J]. 地理研究, 2017, 36(12):2451-2464.
[
|
[3] |
贺力, 陈晨, 王忠民, 等. 城市微环境与盗窃犯罪关系研究进展[J]. 地理研究, 2022, 41(11):2912-2931.
[
|
[4] |
|
[5] |
|
[6] |
|
[7] |
|
[8] |
|
[9] |
|
[10] |
|
[11] |
|
[12] |
|
[13] |
|
[14] |
|
[15] |
|
[16] |
|
[17] |
|
[18] |
|
[19] |
|
[20] |
|
[21] |
|
[22] |
|
[23] |
|
[24] |
|
[25] |
|
[26] |
|
[27] |
|
[28] |
|
[29] |
|
[30] |
|
[31] |
|
[32] |
|
[33] |
|
[34] |
|
[35] |
古恒宇, 沈体雁, 刘子亮, 等. 基于空间滤波方法的中国省际人口迁移驱动因素[J]. 地理学报, 2019, 74(2):222-237.
[
|
[36] |
|
[37] |
|
[38] |
|
[39] |
|
[40] |
|
[41] |
|
[42] |
|
[43] |
|
[44] |
刘瑜, 汪珂丽, 邢潇月, 等. 地理分析中的空间效应[J]. 地理学报, 2023, 78(3):517-531.
[
|
[45] |
|
[46] |
|
[47] |
|
[48] |
|
[49] |
|
[50] |
|
[51] |
|
[52] |
|
[53] |
|
[54] |
|
[55] |
|
[56] |
|
[57] |
|
[58] |
吴佩洁, 孟祥海, 曹梦迪. 城市交通事故多发点鉴别与时空模式挖掘[J]. 中国安全科学学报, 2020, 30(11):127-133.
[
|
[59] |
|
[60] |
贺日兴, 唐宗棣, 姜超, 等. 顾及道路权重的图卷积犯罪时空预测模型[J]. 地球信息科学学报, 2023, 25(10):1986-1999.
[
|
[61] |
|
[62] |
|
[63] |
|
[64] |
|
[65] |
|
[66] |
张延吉, 庄宇丹, 邓伟涛, 等. 盗窃犯罪易发地的构成、影响及其区域异质性:基于地理探测器方法[J]. 地理研究, 2022, 41(11):2884-2896.
[
|
[67] |
龙冬平, 柳林, 冯嘉欣, 等. 社区环境对入室盗窃和室外盗窃影响的对比分析——以ZG市ZH半岛为例[J]. 地理学报, 2017, 72(2):341-355.
[
|
[68] |
李翔, 朱江, 尹向东, 等. 基于珞珈一号夜间灯光数据的广州市建设用地识别[J]. 地球信息科学学报, 2019, 21(11):1802-1810.
[
|
[69] |
林丹淳, 谭敏, 刘凯, 等. 代表性人口空间分布数据集的精度评价——以2010年广东省为例[J]. 热带地理, 2020, 40(2):346-356.
[
|
[70] |
杨志刚, 徐期瑚, 黄金玲. 基于WorldPop数据的广东省自然保护区人口分布情况分析[J]. 广东园林, 2022, 44(6):32-36.
[
|
[71] |
张锴. 基于夜间灯光数据像元尺度的陕西省GDP预测研究[D]. 西安: 陕西师范大学, 2019.
[
|
[72] |
梁源钊, 魏冶. 城市收缩的时空格局与影响因素:德国东部地区与中国东北地区的对比研究[J]. 世界地理研究, 2023:1-14.
[
|
[73] |
|
[74] |
龙冬平, 岳瀚, 陈建国. 顾及时间效应的周围人口与视频监控对街头抢劫者作案地选择的影响研究[J]. 地理科学进展, 2021, 40(10):1716-1729.
[
|
[75] |
|
[76] |
|
[77] |
|
/
〈 |
|
〉 |