Journal of Geo-information Science >
Overview and Prospect for Spatial-Temporal Prediction of Crime
Received date: 2020-05-19
Revised date: 2020-06-29
Online published: 2021-03-25
Supported by
National Natural Science Foundation of Beijing(9192022)
National Engineering Laboratory Director Fund for Social Security Risk Perception and Prevention and Control of Large Data Applications()
Copyright
As the core technology of predictive policing, Spatial-Temporal (ST) prediction of crime has developed rapidly from around 2000 to the present. We introduce the basic theory of ST prediction of crime at the beginning. We regard the ST prediction method of crime as a process combining corresponding models to predict the ST distribution of crimes in the future and deconstruct it into relationships between three objects: case, ST backcloth, and individual behavior. Then, based on the input factors of prediction models, we sum up three current main methods, including ① the prediction method based on the information of cases' ST location, ② the prediction method based on the backcloth and the information of cases' ST location, and ③ the prediction method based on individual behavior, the backcloth, and the information of cases' ST location. We further summarize the mechanisms of different methods in detail respectively. In addition, we compare and analyze each method based on their applicable scenarios and predictive capacities. Finally, with the development of big data technology, we present solutions to improve current prediction methods, that are to construct a data-fusion system, refine data granularity, and integrate new types of data. For model optimization, we need to improve the ability of integrating heterogeneous data from multiple sources and balancing the interpretability and predictive ability of models.
GU Haisuo , CHEN Peng , LI Huibo . Overview and Prospect for Spatial-Temporal Prediction of Crime[J]. Journal of Geo-information Science, 2021 , 23(1) : 43 -57 . DOI: 10.12082/dqxxkx.2021.200247
表1 犯罪时空预测方法分类(按照输入变量复杂程度排序)Tab. 1 Classification of ST prediction methods of crime (ordered by the complexity of variables) |
方法类型 | 输入变量 | 主要模型 | 提出时间 |
---|---|---|---|
基于案件时空位置信息的犯罪时空预测 | 案件时空位置信息(主要为空间栅格数据) | 犯罪临近重复模型 核密度估计模型 自激点震荡模型 机器学习模型 | 20世纪90年代 |
基于时空环境要素的犯罪时空预测 | 案件时空位置信息,时空环境背景要素(分为空间栅格数据和网络数据) | 风险地形建模 贝叶斯预测模型 离散选择模型 张量模型 机器学习模型 图传播模型 时空搜索窗模型 | 20世纪90年代 |
融合行为轨迹和时空环境要素的犯罪时空预测 | 案件时空位置信息,时空环境背景要素,主体行为轨迹 (主要为空间栅格数据) | 离散选择模型 机器学习模型 | 2015年前后 |
表2 机器学习模型及其预测效果Tab. 2 The methods adopted by the machine learning model and theirs prediction effect |
方法 | 预测效果 | 提出/使用者 | 研究时间/年 |
---|---|---|---|
逻辑回归与神经网络结合的模型 | 神经网络模型相比逻辑回归模型有更高的直接命中率但收效甚微,二者结合的模型能平衡预测精度和直接命中率[58] | Rummens等[58] | 2017 |
DeepCrime | DeepCrime模型在多种预测场景下均表现出了相比支持向量机(SVR)、ARIMA、逻辑回归、多层感知机、TriMine、GRU、Wide&Deep等7种模型更佳的预测效果[59] | Huang等[59] | 2018 |
GSRNN时空预测模型 | GSRNN时空预测模型兼顾了时空关联性,相比仅基于LSTM的神经网络模型具有更好的预测效果[60] | Wang等[60] | 2018 |
基于随机森林的模型 | 加入环境协变量的模型相比未加入的模型预测效果更佳[29] | Liu等[29] | 2019 |
基于LSTM的时空预测模型 | 基于LSTM的神经网络时空预测模型相比ARIMA和随机森林模型预测效果更佳[61] | Pan[61] | 2019 |
4.2.2 输入数据为空间网络 |
表3 图传播模型及其预测效果Tab. 3 The methods adopted by the graph-based model and theirs prediction effect |
方法 | 预测效果 | 提出/使用者 | 研究时间/年 |
---|---|---|---|
基于网络的K邻近法(Network K-function) | 基于网络的K邻近法相比基于平面的方法更加符合实际案件时空分布[75] | Lu等[75] | 2007 |
基于网络的入室盗窃模型 | 基于网络的模型明显优于非网络模型[73] | Davies等[73] | 2013 |
基于网络的时空核密度估计(NTKDE) | 基于网络的模型在预测精度及效果上明显强于基于平面的模型[72] | Rosser等[72] | 2017 |
NTKDE 门控局部扩散网络模型(GLDNet) | 门控局部扩散网络模型预测效果优于基于网络的时空核密度估计模型[72,74,76] | Zhang等[72,74,76] | 2019 |
表4 时空搜索窗模型及其预测效果Tab. 4 The methods adopted by the search window model and theirs prediction effect |
方法 | 预测效果 | 提出/使用者 | 研究时间/年 |
---|---|---|---|
基于网络的犯罪时空分析 (NT-STAC) 基于网络的空间扫描统计 (NT-SaTScan) | 其他条件相同情况下,基于网络的方法总体强于基于平面的方法[77] | Shiode等[77] | 2011 |
基于网络的空间搜索窗犯罪时空分析模型(SNT-STAC) 基于网络的时空搜索窗犯罪时空分析模型(STNT-STAC) | 其他条件相同情况下,预测效果上,基于时空的模型优于基于空间的模型[78] | Shiode等[78] | 2013 |
时间搜索窗犯罪分析模型(TAC) 基于网络的犯罪空间搜索窗分析模型(SACNT) 基于网络的犯罪时空搜索窗分析模型(STACNT) | 其他条件相同情况下,基于网络的方法总体强于基于平面的方法;其他条件相同情况下,在预测效果上,基于时空的模型优于基于空间的模型优于基于时间的模型[79] | Shiode等[79] | 2015 |
表5 不同研究人员所采用的输入变量、模型、对比形式及预测效果Tab. 5 The input variables, models, comparative forms and predictive effects used by different researchers |
输入变量 | 模型 | 对比形式 | 效果 | 提出/使用者 | 研究时间/年 |
---|---|---|---|---|---|
案件:犯罪数据 时空静态类:POI数据 时空动态类:浮动车数据 | 线性回归模型 负二项回归模型 GWNBR | 模型间对比 | 基于地理加权回归的负二项回归模型效果最佳[85] | Wang等[84] Wang等[85] | 2016 2017 |
案件:犯罪数据 时空静态类:POI数据 时空动态类:签到数据 | 负二项回归模型 线性回归模型 随机森林模型 | 模型间对比 | 随机森林模型预测效果最佳[86] | Shakila Khan Rumi等[86] | 2019 |
案件:盗窃案件数据 时空静态类:POI数据 空间静态时间动态类:基站信令数据 | 离散选择模型 | 是否增加非时空静态类数据 | 增加非时空静态类数据可以提升预测精度[80] | Song等[80] | 2019 |
案件:侵财类案件数据 时空静态类:警务对策数据、土地利用数据、人口普查数据、经济普查数据 空间静态时间动态类:流动人口数据 | BP神经网络模型 GA-BP神经网络模型 | 模型间对比 | 改进的GA-BP模型预测效果更佳[87] | Li等[87] | 2017 |
案件:单类犯罪数据、公共服务投诉数据 空间静态时间动态类:气象数据 时空动态类:浮动车数据、POI签到数据 | TCP CSI ARMA LASSO 线性回归模型 时空多任务学习模型 | 模型间对比 | TCP能取得最优预测效果[83] | Zhao等[83] | 2017 |
案件:警情数据 时空静态类:人口网格数据 空间静态时间动态类:基站信令数据 时空动态类:浮动车数据、地铁刷卡数据 | 负二项回归模型 | 是否增加非时空静态类数据 | 增加非时空静态类数据可以提升预测精度[81] | Song等[81] | 2018 |
案件:多种类犯罪案件数据 时空静态类:人口统计数据 空间静态时间动态类:场馆使用数据 时空动态类:浮动车数据、地铁刷卡数据 | 随机森林模型 梯度提升模型 Extra-Tree模型 | 不同数据对结果作用效果对比;模型间对比 | 不同类型案件对增加非时空静态类数据的敏感度不同,但都能提升预测效果;不同犯罪类型预测并没有一个完全最优的模型[82] | Kadar等[82] | 2018 |
[1] |
|
[2] |
|
[3] |
魏平雄, 赵宝成, 王顺安 . 犯罪学教程[M]. 北京: 中国政法大学出版社, 1998.
[
|
[4] |
|
[5] |
|
[6] |
|
[7] |
|
[8] |
|
[9] |
|
[10] |
|
[11] |
|
[12] |
李国军 . 预测警务的理论基础与技术路径研究[J]. 湖北警官学院学报, 2016,29(5):79-86.
[
|
[13] |
|
[14] |
|
[15] |
|
[16] |
ChaineyS,
|
[17] |
|
[18] |
|
[19] |
徐冲, 柳林, 周素红 . 基于临近相似性考虑的犯罪热点密度图预测准确性比较——以DP半岛街头抢劫犯罪为例[J]. 地理科学, 2016,36(1):55-62.
[
|
[20] |
|
[21] |
|
[22] |
|
[23] |
|
[24] |
|
[25] |
|
[26] |
|
[27] |
|
[28] |
柳林, 刘文娟, 廖薇薇 , 等. 基于随机森林和时空核密度方法的不同周期犯罪热点预测对比[J]. 地理科学进展, 2018,37(6):25-35.
[
|
[29] |
柳林, 纪佳楷, 宋广文 , 等. 基于犯罪空间分异和建成环境的公共场所侵财犯罪热点预测[J]. 地球信息科学学报, 2019,21(11):1655-1668.
[
|
[30] |
|
[31] |
|
[32] |
|
[33] |
|
[34] |
沈寒蕾, 张虎, 张耀峰 , 等. 基于长短期记忆模型的入室盗窃犯罪预测研究[J]. 统计与信息论坛, 2019,34(11):107-115.
[
|
[35] |
|
[36] |
陈鹏, 李欣, 胡啸峰 , 等. 北京市长安街沿线的扒窃案件高发区分析及防控对策[J]. 地理科学进展, 2015,34(10):1250-1258.
[
|
[37] |
|
[38] |
|
[39] |
张宁, 王大为 . 基于风险地形建模的毒品犯罪风险评估和警务预测[J]. 地理科学进展, 2018,37(8):1131-1139.
[
|
[40] |
|
[41] |
|
[42] |
|
[43] |
|
[44] |
|
[45] |
|
[46] |
|
[47] |
|
[48] |
|
[49] |
何晓群 . 现代统计分析方法与应用[M]. 北京: 中国人民大学出版社, 2016.
[
|
[50] |
|
[51] |
|
[52] |
|
[53] |
|
[54] |
|
[55] |
|
[56] |
|
[57] |
段炼, 党兰学, 胡涛 , 等. 融合历史犯罪数据的疑犯社会活动位置预测[J]. 地球信息科学学报, 2018,20(7):929-938.
[
|
[58] |
|
[59] |
|
[60] |
|
[61] |
潘仲赢 . 基于机器学习算法的犯罪预警系统设计与实现[D]. 成都:电子科技大学, 2019.
[
|
[62] |
|
[63] |
|
[64] |
|
[65] |
|
[66] |
|
[67] |
|
[68] |
|
[69] |
|
[70] |
|
[71] |
|
[72] |
|
[73] |
|
[74] |
|
[75] |
|
[76] |
|
[77] |
|
[78] |
|
[79] |
|
[80] |
|
[81] |
|
[82] |
|
[83] |
|
[84] |
|
[85] |
|
[86] |
|
[87] |
李卫红, 闻磊, 陈业滨 . 改进的GA-BP神经网络模型在财产犯罪预测中的应用[J]. 武汉大学学报·信息科学版, 2017,42(8):1110-1116,1171.
[
|
[88] |
徐志刚 . 专论:公安大数据应用期待观念更新[J]. 人民公安, 2019,68(10):13-13.
[
|
/
〈 | 〉 |