Overview and Prospect for Spatial-Temporal Prediction of Crime

  • GU Haisuo 1, * ,
  • CHEN Peng , 1 ,
  • LI Huibo 2
Expand
  • 1. School of Information Network Security, People's Public Security University of China, Beijing 102600 China
  • 2. National Engineering Laboratory for Public Safety Risk Perception and Control by Big Data (PSRPC), Beijing 100043, China
*GU Haisuo, E-mail:

Received date: 2020-05-19

  Revised date: 2020-06-29

  Online published: 2021-03-25

Supported by

National Natural Science Foundation of Beijing(9192022)

National Engineering Laboratory Director Fund for Social Security Risk Perception and Prevention and Control of Large Data Applications()

Copyright

Copyright reserved © 2010.

Abstract

As the core technology of predictive policing, Spatial-Temporal (ST) prediction of crime has developed rapidly from around 2000 to the present. We introduce the basic theory of ST prediction of crime at the beginning. We regard the ST prediction method of crime as a process combining corresponding models to predict the ST distribution of crimes in the future and deconstruct it into relationships between three objects: case, ST backcloth, and individual behavior. Then, based on the input factors of prediction models, we sum up three current main methods, including ① the prediction method based on the information of cases' ST location, ② the prediction method based on the backcloth and the information of cases' ST location, and ③ the prediction method based on individual behavior, the backcloth, and the information of cases' ST location. We further summarize the mechanisms of different methods in detail respectively. In addition, we compare and analyze each method based on their applicable scenarios and predictive capacities. Finally, with the development of big data technology, we present solutions to improve current prediction methods, that are to construct a data-fusion system, refine data granularity, and integrate new types of data. For model optimization, we need to improve the ability of integrating heterogeneous data from multiple sources and balancing the interpretability and predictive ability of models.

Cite this article

GU Haisuo , CHEN Peng , LI Huibo . Overview and Prospect for Spatial-Temporal Prediction of Crime[J]. Journal of Geo-information Science, 2021 , 23(1) : 43 -57 . DOI: 10.12082/dqxxkx.2021.200247

1 引言

预测警务的快速发展带动了数据分析技术在公安工作中的深度应用。警务工作开始逐渐从以事后侦查打击为主的被动工作模式向以事前预测为主的主动工作模式转变,由此带来了警务工作的深刻变革。在预测警务中,犯罪时空风险预测是一个重要的研究方向,其核心需求为:通过对犯罪活动的时空分布进行分析,厘清犯罪活动的时空模式,并对特定区域未来一段时间内的犯罪活动风险概率进行预测,以有效指导警力资源的合理调配,最大程度提升警务资源的使用效率。
犯罪时空预测经历了一个相当长的发展历史,从某种程度上与数据科学的发展有着密切的关系。特别是近些年随着大数据时代的到来,与犯罪时空有关的数据在广度和深度上都有了指数级的增长。这种趋势不但促进了公安信息化建设应用的快速发展,使公安各级业务部门向着“数据业务化,业务数据化”的目标前进,更促进了犯罪时空预测向着精细化、动态化的方向发展,极大拓展了犯罪时空预测的适用场景。此外,从预测模型和算法上,近年来快速发展的各类数据模型和算法也对犯罪时空预测起到了有力的推动作用,从早期处理能力有限、算法简单的线性模型,到能够处理高维特征数据、算法复杂度高的非线性模型,算法的不断迭代也在提升犯罪时空预测性能和结果可靠性的同时,为犯罪时空预测在警务中的实践应用提供了强有力的保证。
近年来,随着数据科学的迅速发展,犯罪时空预测也吸引了除犯罪学以外,包括地理学、计算机科学等相关行业研究人员的浓厚兴趣,产出了一批高质量的研究成果。基于此,本文对近年来的犯罪时空预测方法研究现状进行系统性介绍和梳理,总结当前数据科学技术和警务实践的发展趋势,并展望犯罪时空预测方法未来的发展前景和面临的挑战。

2 犯罪时空预测的应用背景

犯罪时空预测的提出源于预测警务模式的发展。美国兰德公司的研究报告指出[1]:“预测警务是通过统计分析来指导警务部门打击犯罪,或预测违法犯罪最可能针对的目标来预防犯罪的一种警务模式”。学者Ratcliffe在2014年把预测警务定义为[2]:“利用历史数据建立犯罪活动或犯罪热点地区的时空预测模型,以此作为警力资源分配的基础,并期望在预测的地点和时间区间内部署相应的警力资源来阻止或预防犯罪活动”。从定义上来看,Ratcliffe将犯罪时空预测视为预测警务的核心功能。而通过对近年来的研究和实际应用情况进行梳理,可以认为:“犯罪时空预测就是运用科学方法,通过对现有的犯罪数据和资料以及对可能影响犯罪的各种相关因素进行分析、研究,对在未来一定时空范围内可能出现的犯罪现象的状况、结构、发展趋势等所作的判断,是制定犯罪预防战略和战术措施重要的科学依据[3]”。
预测警务的流程主要包括4个步骤(数据收集、数据分析、警务操作及犯罪响应)及3种犯罪干预类型(一般、特定犯罪、特定问题)。由图1可见,犯罪时空预测的作用域介于“警务操作”与“数据分析”之间,具体来说是“数据融合”之后的“数据分析”,即在得出“预测”结论后实施相关的“警务操作”以“干预”现实中的犯罪,最终再通过“犯罪响应”的结果来“评估”犯罪时空预测的结果以进一步调整“警务操作”和预测模型。
从流程上,犯罪时空预测分析过程具体包括数据收集与准备、数据建模、结果可视化[4],其中数据建模还可以进一步分为数据训练和数据预测。而在实施过程上则主要分为选择输入要素变量、选择预测算法工具和犯罪时空风险预测结果输出3个步骤。其中输入要素变量的选择为犯罪时空风险预测的数据准备阶段,预测算法和工具的选择为犯罪时空风险预测建模阶段,这2个步骤是犯罪时空风险预测的核心组成。
图1 预测警务的业务流程[1]

Fig. 1 Operation flow of predictive policing

3 犯罪时空预测方法的分类

早期的犯罪时空预测主要依据犯罪的临近重复效应[5,6]进行建模预测,随着环境犯罪学的兴起,近年来犯罪时空预测的大部分工作开始以环境犯罪学作为主要建模依据。环境犯罪学主要解释了犯罪活动在时空环境下的发生过程,具体包括理性选择理论[7,8](Rational Choice Theory)、日常活动理论[9](Routine Activity Theory)以及犯罪模式理论[10,11,12](The Geometry of Crime and Crime Pattern Theory)等多个基础理论[13]。理性选择理论、日常活动理论以及犯罪模式理论分别从环境对罪犯决策行为的影响,以及罪犯、潜在受害目标和受害目标监护对象的时空行为等方面,对犯罪活动在时空内的分布进行了解释。从系统的角度来看,可以将犯罪活动的发生过程理解为3个主要的要素构成,即主体、时空环境和案件。其中主体是犯罪活动系统中的各类行为人,包括罪犯、受害人、监护人等,时空环境则是各类主体和犯罪活动发生的时空背景和空间载体,案件则是在特定的时空环境下不同行为人之间相互作用所产生的结果,即各类违法犯罪活动。因此,从这一视角来看,犯罪的发生过程可以理解为:在一定环境背景下有着特定时空行为模式(犯罪模式理论)的各类主体(包括罪犯、受害人以及监护人),当主体之间满足一定的时空位置关系(日常活动理论),并且罪犯认为这种条件对其有利时(理性抉择理论),罪犯就会倾向于实施犯罪。据此,犯罪时空预测可以理解为利用主体、时空环境、案件等要素之间的相互作用关系来预测犯罪活动时空风险的过程。
主体、案件和时空环境构成了犯罪时空预测方法的主要输入要素变量,根据输入变量的不同,当前的犯罪时空预测方法大体可以分为3类:基于案件时空位置信息的犯罪时空预测方法、基于时空环境要素的犯罪时空预测方法、融合行为轨迹和时空环境要素的犯罪时空预测方法。
(1)基于案件时空位置信息的犯罪时空预测方法。该类方法基于早期的犯罪时空预测理论,主要依据Sherman和Farrell等[5,6]发现的犯罪在时空上存在的临近重复现象进行建模,即对以往历史案件的时空位置信息进行规律总结的基础上,利用合适的算法模型对未来的时空范围内犯罪活动的分布进行预测。这类方法最早于20世纪90年代(表1)提出,其输入变量一般只有案件的时空位置以及案件类型、手段类型等附属的案件信息,输出未来犯罪的时空分布状况,即以“事件”预测“事件”。该方法代表性的模型主要有临近重复预测模型、核密度估计模型、自激点震荡模型、神经网络模型等。
表1 犯罪时空预测方法分类(按照输入变量复杂程度排序)

Tab. 1 Classification of ST prediction methods of crime (ordered by the complexity of variables)

方法类型 输入变量 主要模型 提出时间
基于案件时空位置信息的犯罪时空预测 案件时空位置信息(主要为空间栅格数据) 犯罪临近重复模型
核密度估计模型
自激点震荡模型
机器学习模型
20世纪90年代
基于时空环境要素的犯罪时空预测 案件时空位置信息,时空环境背景要素(分为空间栅格数据和网络数据) 风险地形建模
贝叶斯预测模型
离散选择模型
张量模型
机器学习模型
图传播模型
时空搜索窗模型
20世纪90年代
融合行为轨迹和时空环境要素的犯罪时空预测 案件时空位置信息,时空环境背景要素,主体行为轨迹
(主要为空间栅格数据)
离散选择模型
机器学习模型
2015年前后
(2)基于时空环境要素的犯罪时空预测方法。这种方法相比于基于案件时空位置信息的犯罪时空预测,更多的考虑了时空环境对犯罪时空风险的影响。该方法主要基于环境犯罪学中的理性选择理论提到的环境(包括日常生活的生活方式及其动机、生活需求及其诱因,以及为实现特定目标而采取机动的更为特殊的环境)对犯罪行为的直接影响[7,8],以及犯罪模式理论中对时空背景(The Backcloth)和认知空间(Awareness Space)的相关理论进行建模[11],即通过研究犯罪活动的时空风险分布与时空环境变量的关系来验证和预测犯罪活动的时空分布特征。因此从原理上,该方法相比基于案件时空位置信息的犯罪时空预测方法更具可解释性。这一类预测方法出现的较早,最早的研究可追溯至20世纪70年代(表1),但在2000年以前发展过程较为缓慢。这种方法利用结合了上下文(特指时空环境要素)的“事件”预测“事件”,在输入的数据上可以分为栅格和网络2种结构,相应的模型有风险地形建模、贝叶斯预测模型、离散选择模型、张量模型、图传播模型、时空搜索模型等。
(3)融合行为轨迹和时空环境要素的犯罪时空预测方法。这一类方法相当于在时空环境基础上进一步融合了犯罪活动主体的行为特征。该类方法主要基于日常活动理论中人们的日常行为和犯罪风险之间的关系的相关理论,以及犯罪模式理论中人在城市中的行为模式和犯罪的时空聚集现象之间的关联的相关理论进行建模,即在特定的时空环境下考虑了不同类型人员的时空行为对犯罪风险的直接作用,因此理论上,该类方法不仅具有较强的可解释性,在预测的效果上也具有更好的精准性。由于使用“主体行为”、“环境”两类要素的“事件”预测“事件”,因此该方法对输入数据的类型、质量要求更高,对预测的模型和算法也有着较为严格的要求。该方法常用的模型主要有基于回归分析的预测模型和基于机器学习的预测模型等。

4 不同类型犯罪时空预测方法的基本原理

在建立犯罪时空预测方法分类的基础上,本文进一步对不同类型的犯罪时空预测方法的原理展开介绍,并对其预测效果和应用条件进行比较。

4.1 基于案件时空位置信息的犯罪时空预测

(1)临近重复预测模型
犯罪活动的临近重复现象是指在某个目标地点发生了某类案件后,该目标或其临近时空范围相比平时会面临多次同类犯罪发生的更高几率,这种现象也是犯罪时空聚集性的体现之一,其核心思想是判断相近点对个数相比较一般随机分布状态下存在的点对个数是否有显著性意义[14]。在具体实现上,一般使用Townsley等[15]提出的修正纳克斯检验法,该方法的计算过程为:
①对N个案件St, y分别计算每个案件 S t , y i 至其他N-1个案件的时间距离δtij和空间距离,δlij,( j=1,2, …, N, ji);
②设定不同的时间与空间临界值ΔTkΔLk ( k=0, 1, …, m),根据案件 S t , y i 与案件 S t , y j 的时间距离δtij与空间距离δlij计算位于不同时空临界值范围内的案件对Γij(i=0, 1, …, N; j=0, 1, …, N, ji)的数量,最终形成一个m×m的矩阵Φ;
③采用蒙特卡罗仿真方法进行检验,即先假定案件之间的时间距离与空间距离呈相互独立状态,在保持案件的空间信息不变基础上,随机重排时间信息并按步骤①-步骤②重新统计矩阵Φ中各要素的数量,然后计算结果的置信度p,p=1-ne/(1+ns)。其中,ne为对应时间临界值ΔTk与空间临界值ΔLk范围内实际案件对数量大于模拟案件对数量的次数,ns为蒙特卡洛模拟的次数。模拟次数越多,则结果置信度越高。
根据计算出的犯罪活动在时空上的临近重复性带宽,便可以对犯罪时空风险进行相应的预测,具体做法是:对最新发生的案件赋予一个相应的空间带宽半径,则在接下来的一定时间内,临近重复计算得到的犯罪风险即为该空间半径范围内的发案概率。
(2)核密度估计预测模型
20世纪末,研究人员开始大量使用核密度估计(KDE)方法来进行预测性犯罪制图(Prosepective Mapping)[16,17]。核密度估计是一种从数据样本本身出发研究数据分布特征的方法,即在指定带宽(或称平滑参数、窗口宽度)h的情况下,采用平滑的峰值函数(核函数)来拟合观察到的数据点,从而对真实的概率分布曲线进行模拟。其原理为:
已知,x1, x2, x3, …, xn为独立同分布Fn个样本点,其概率密度函数为 f ,定义K(·)为非负且积分为1的核函数(注:均值为0,符合概率密度性质),则核密度估计可以表示为下式:
f ˆ h x = 1 n i = 1 n K h ( x - x i ) = 1 n h i = 1 n K x - x i h
式中:h>0, K h x = 1 h K x h 为缩放核函数。通过这种方法即可得到带宽范围内案件出现概率密度,从而可以进行预测。
2004年,Bowers等[18]改良了核密度估计的方法,提出了ProMap模型,该模型根据发案时间赋予了每个地点相应的权重,加权函数则可以进行自定义。Bowers等[18]将空间上的带宽设置为了400 m,即每个栅格大小为400 m×400 m,并将该范围内的犯罪案件进行加权,逐一计算其相对该栅格内初始案件的权重(式(2))。
Y ( i ) = 1 d × t
式中:Y为权重的计算结果;i为当前计算的栅格;d为相对栅格中心的距离;t为相对该栅格初始案件的时间间隔,根据该式计算得到的是未来t时间内整个单元格的风险强度。融入时间效应的核密度估计模型在预测效果上会有一定程度的提升,相关的研究也验证了基于时空临近相似性计算的模型在多种场景下均具有更好的预测效果[19]
(3)自激点震荡模型
20世纪90年代,研究人员发现犯罪活动的时空分布与地震后的余震现象具有一定的相似性,即在特定的时间和地点发生了犯罪活动后,在接下来的时间内、在该地点周边会出现一系列的同类型案件。Mohler则在2011年受地震学中Daley等[20,21,22]提出的基于自激点震荡过程的余震模型的启发,提出了适用于入室盗窃的自激点震荡模型[23,24]。Mohler将背景案件的时间和空间效应进行了分离(式(3))。
λ t , x , y = ν t μ x , y + { k : t k < t } g t - t k , x - x k , y - y k
式中:λ(·)为预测的犯罪时空风险;v(·)为背景事件的时间函数;μ(·)为背景事件的空间函数;g代表由背景事件引发的余震事件(Aftershock)的核函数。背景案件i发生的概率pii可以表示为:
p ii = μ t i , x i , y i λ t i , x i , y i
由案件j触发案件i的概率pji为:
p ji = g t i - t j , x i - x j , y i - y j λ t i , x i , y i
Ppji组成的矩阵,给定一个初始化的预估矩阵P0,即可利用非参数估计的方法从Pn-1估计μngn并利用式(4)和式(5)迭代更新Pn,循环上述步骤到收敛。同时,Mohler考虑到计算的复杂度问题,采用了基于蒙特卡罗方法的迭代过程来减小计算复杂度。
(4)基于机器学习的模型
近年来,神经网络模型的发展赋予了人们更高的技术能力,越来越多的研究人员开始尝试用基于机器学习的模型来拟合犯罪时空数据来进行犯罪时空预测[25,26]。具体做法是:将预测空间位置划分为大小合适的网格[27],将案件数据按照一定的时间间隔切片或者通过一定尺度的滑动窗口聚合,利用随机森林[28,29]、卷积神经网络[30,31]或者条件随机场[32]等提取空间维度特征的模块组成,利用循环神经网络或其变体提取时间维度的特征[31,32,33,34],随后通过全连接层或者残差层增加网络深度以便更好地拟合数据。由于神经网络模型采用梯度下降进行训练,因此在数据量相对较大的场景下,一般都能得到比核密度估计、自激点震荡、线性回归等参数相对较少的模型更好的预测效果。
总体来看,在适用场景上,犯罪临近重复预测模型只适用于对单一案件的时空预测;核密度估计模型和自激点震荡模型相比于临近重复预测模型的适用场景更广,可以针对全局的案件时空信息进行犯罪时空预测;神经网络模型复杂度更高,且高度的模块化使得基于神经网络的模型可以依据场景的不同而灵活变更,并适用于数据量较大的时空预测场景,能够取得比其他几种模型的更好的预测效果。
基于案件时空位置信息的犯罪时空预测方法适用于只有案件信息数据而其他基础背景环境数据和精细化主体行为数据缺失或不足且较大时空尺度场景下的犯罪时空风险预测,从预测效果看,该类模型能够满足宏观趋势统计分析的相关需求,但在预测较小时空尺度下的犯罪时空风险则效果较差。

4.2 基于时空环境要素的犯罪时空预测

基于案件时空位置信息的犯罪时空预测由于仅采用了案件的时空坐标信息,因此输入的数据主要以空间栅格数据为主,而基于时空环境要素的犯罪时空预测由于在案件时空位置的基础上考虑了时空环境特征变量,因此在输入数据的类型上稍为复杂,具体可以分为空间栅格数据和空间网络数据2种,而相应的预测模型也都围绕着2种输入数据而构建。
4.2.1 输入数据为空间栅格
已有的研究表明[35,36],时空环境要素与犯罪的发生是存在关联性的,即犯罪所在的局部时空环境特征和犯罪活动的发生存在着一定的关联。这一类模型将局部时空环境特征定义为按照一定经验划分的栅格区域(或包含其邻域),将当前处理的局部时空环境特征(也可包含案件信息)经过一定的方式处理成特征向量作为输入,然后计算该特征向量与局部时空案件信息的关联性。
(1)风险地形建模
风险地形建模是一种典型的多栅格图层分析模型(Risk Terrain Modelling, RTM)[37,38]。风险地形建模的原理可以用图2表示。① 根据现有数据列出与当前待预测犯罪相关的变量,并将这些变量分别绘制在不同的图层上,然后将已有的犯罪时空坐标按照等长的时间切片投影到图层上形成多个子风险图层;② 对多个子风险图层进行回归分析,利用广义线性模型(Generalize Linear Model)确定各个因素与犯罪活动的函数关系,以及犯罪活动在时空上的转移规律;③ 通过第②步得出的函数关系计算犯罪风险数值,并作为犯罪时空预测的依据,即可预测未来的犯罪时空分布。
图2 风险地形建模原理示意

Fig. 2 Principle of risk terrain modeling

通过上述3个步骤即可生成该类型犯罪活动的风险地图。风险地形建模通过分析历史犯罪活动和周边环境要素(酒吧、旅馆、网吧等POI,还有公交站、地铁站等出行要素)之间的关系,量化了各要素的风险值,利用多种数据源形成的图层叠加,形成最后的时空预测效果[39]
(2)贝叶斯预测模型
一些研究人员认为,犯罪活动的发生符合二项统计分布(一般为泊松分布),即:
Y it ~ Binomial ( n it , p it )
式中:Yit代表犯罪案件数量;nit代表潜在犯罪目标;pit代表犯罪率;i为空间区域序号;t为时序序号。犯罪活动的逻辑函数形式一般可以表示如下:
log it p it = α + A i + B t + C it
式中:α为犯罪活动平均相对风险的对数;Ai为犯罪活动的空间效应,包括空间非结构效应U(i)和结构效应S(i),前者反映空间异质性,后者反映空间相关性[40],空间结构效应的先验分布多为条件自回归(Conditional Autoregressive)或同步自回归(Simultaneous Autoregressive)。Bt代表时间效应,其先验分布一般表示为一阶自回归(1 order Autoregressive),Cit代表时空交互效应。为了综合多源数据以提高模型的预测精度,犯罪活动的逻辑函数通用表达式如下:
log it p it = α + β X it + A i + B t + C it
式中:βXit为其他存在潜在影响的时空变量,如用地类型、POI信息、社区信息等。模型的运算采用MCMC算法,常见的比较指标有赤池信息准则(AIC)、贝叶斯信息准则(BIC)和离差信息准则(DIC)等。
贝叶斯预测模型大多利用人口普查数据进行犯罪时空预测。早期的研究仅利用αU(i)建模犯罪活动[41,42]。Law等[43]考虑到空间效应对犯罪发生的影响,利用内禀条件自回归(Intrinsic CAR)模型将S(i)引入logit(pit)。相比仅有αU(i)的模型,引入S(i)后的模型能更准确地预测时空热点[44,45,46]。之后相关研究又将时间效应Bi和时空效应Cit引入预测模型,构建时空贝叶斯模型进行了犯罪趋势预测[47]。相比以往研究中所使用的核密度估计、自激点震荡过程等模型,时空贝叶斯模型不直接识别时空热点,而是关注于特定区域内的犯罪活动“变化”,并且实际预测误差较小[47,48]
(3)离散选择模型
离散选择模型是社会学、生物统计学、数量心理学、市场营销等统计实证分析中的常用方法,其分析的行为通常包含决策者、备选方案集、各个方案的属性以及决策准则[49]。该模型的核心是一个主体需要在众多离散空间的选择方案中做出唯一选择,例如,如果主体i需要从备选方案j中计算每个方案的效用(净收益、利润等),则该效用可用下式表示:
U ij = β ' z ij + e ij
式中:zij是一组对应选择的不同属性,该属性也可能因人而异; β 是凭经验估算的系数列向量;eij是随机误差项,表征了主体和备选方案未度量的相关属性以及度量误差。为了验证关于选择标准的影响的假设,需要将式(9)与对应的统计模型建立关联,如可以假定主体i相对备选方案j的概率为:
Pr ob Y i = j = e β ' z ij j = 1 J e β ' z ij
通过式(9)和式(10)综合计算每个备选方案的效用并做出最优选择。
Bernasco将离散选择模型应用于盗窃犯对目标的选择问题[50,51,52],其他一些离散选择模型的研究[53,54],大多基于Bernasco的工作增加了更多的假设和变量来完善犯罪目标选择的模型。
(4)基于矩阵/张量分解的模型
基于矩阵/张量分解的方式进行犯罪时空预测也逐渐成为一种新趋势,矩阵/张量分解模型的优势在于可拓展性强,能融合各种附加信息。犯罪时空预测任务可以看作是一个矩阵/张量补全的任务,即基于矩阵/张量中已有的记录来填补其中尚未有记录的元素。因此,矩阵/张量分解模型的最终目的在于矩阵/张量补全。首先,需要利用案件信息数据构建最终要补全的时空犯罪矩阵/张量,对于待填补的时空值可以表示为一个具有一维数据特征的预测任务,一般用矩阵表示,即矩阵由时间维度和空间维度组成,2个维度的交互值为该类犯罪发生的数量或发生概率等。该矩阵的分解形式可以表示为:
R n × m = P n × f × Σ f × f × Q f × m T
式中:R∈ℝn×m为待填补矩阵;n为空间维度大小; m为时间维度大小;P∈ℝn×f为空间维度的隐特征矩阵;Q∈ℝm×f为时间维度的隐特征矩阵;∑∈ℝf×f为奇异值矩阵,矩阵分解的方法一般可以采用奇异值分解(SVD)等矩阵因子分解方法[55]
对于时空预测任务的待填补时空值不能用数值表示的,则需要构建张量A∈ℝm×n×l,其中m为犯罪类型数量或者罪犯数量,n为空间维度数量,l为时间维度数量,该张量的分解形式可以表示为:
A m × n × l = S d R × d C × d T × R R m × d R × C C n × d C × T T L × d T
式中:S为核心张量;RCT分别表示犯罪类型、空间、时间的隐特征矩阵;×R、×C、×T分别表示矩阵乘法;dRdCdT分别表示对应的隐特征的维度。张量分解的方法并不唯一,常见的做法是转换为tucker分解形式[55,56,57]求解。随后,通过设计对应的矩阵/张量分解损失函数,利用梯度下降的方法即可得到需要的低秩分解结果,然后通过矩阵乘法还原待填补矩阵/张量。如果还有其他的输入变量,则可基于该矩阵/张量的基础维度结合其他输入变量构建关联矩阵/张量,来融合更多的信息。由于这种计算没有数值解析的方法,因此需要通过协同张量分解的算法计算全局最优值[49]。在预测精度方面,张量模型相比线性回归、基于地理加权的负二项回归等方法有较大的提升[55,57]
(5)机器学习模型
基于机器学习的模型采用梯度下降算法进行犯罪时空预测,不同于矩阵/张量分解模型,机器学习模型以端到端的训练模式为主,除了必要的特征工程外,输入一般不需要特殊处理,其输出就是特定时空的预测结果。机器学习模型种类繁多,随着人工智能技术近年来的迅速发展,犯罪时空预测领域也出现了非常多的预测模型,代表性的模型主要有基于神经网络的模型、基于随机森林的模型、基于逻辑回归的模型等(表2)。
表2 机器学习模型及其预测效果

Tab. 2 The methods adopted by the machine learning model and theirs prediction effect

方法 预测效果 提出/使用者 研究时间/年
逻辑回归与神经网络结合的模型 神经网络模型相比逻辑回归模型有更高的直接命中率但收效甚微,二者结合的模型能平衡预测精度和直接命中率[58] Rummens等[58] 2017
DeepCrime DeepCrime模型在多种预测场景下均表现出了相比支持向量机(SVR)、ARIMA、逻辑回归、多层感知机、TriMine、GRU、Wide&Deep等7种模型更佳的预测效果[59] Huang等[59] 2018
GSRNN时空预测模型 GSRNN时空预测模型兼顾了时空关联性,相比仅基于LSTM的神经网络模型具有更好的预测效果[60] Wang等[60] 2018
基于随机森林的模型 加入环境协变量的模型相比未加入的模型预测效果更佳[29] Liu等[29] 2019
基于LSTM的时空预测模型 基于LSTM的神经网络时空预测模型相比ARIMA和随机森林模型预测效果更佳[61] Pan[61] 2019

4.2.2 输入数据为空间网络

依据犯罪模式理论,每个行为主体都有一系列的日常活动,这些活动发生在家庭、工作、学校等不同的活动节点上,并沿着连接这些活动节点的路径进行,这种环境背景的结构性既影响主体的日常活动,也影响犯罪主体的决策。基于网络的模型就是为了表征这种环境结构性而建立的。大量研究发现,通过空间网络数据表征的空间效应与犯罪活动之间存在显著的关联[62,63,64,65,66,67,68,69,70,71]
(1)图传播模型
图传播模型是利用路网数据设计基于图(Graph)的风险传播算法来进行犯罪时空预测。以基于网络的核密度估计模型为例,图3(a)中s'为核的中心,hs为核密度函数的带宽,A、B、C、D分别代表路口,路口间的线段代表路段。基于平面的核密度估计作用的范围是无差别的,即对核的中心以带宽为半径画圆的范围均需要参与计算,而基于路网的核密度估计模型参与计算的范围仅限于以核中心为起点经过网络距离为带宽长度所涉及的路段,且其作用强度在交叉路口处将均分到目标路段(图3(b))。
图 3 基于图的核密度估计模型[72]

Fig. 3 Graph-based Kernel density estimation model

研究表明,这一类模型在其他条件相同情况下,相比基于空间栅格数据的模型在预测效果上有明显提升(表3[72,73,74,75]。由于对犯罪风险的传播方式进行了约束,因此这种基于图的计算更加符合犯罪模式理论,且基于图传播算法的模型可拓展性较强,也可以结合神经网络的相关算法进行计算[60,74],相比基于空间栅格数据的模型更加贴近实际犯罪风险传播的模式,也因此能获得更较好的预测效果。
表3 图传播模型及其预测效果

Tab. 3 The methods adopted by the graph-based model and theirs prediction effect

方法 预测效果 提出/使用者 研究时间/年
基于网络的K邻近法(Network K-function) 基于网络的K邻近法相比基于平面的方法更加符合实际案件时空分布[75] Lu等[75] 2007
基于网络的入室盗窃模型 基于网络的模型明显优于非网络模型[73] Davies等[73] 2013
基于网络的时空核密度估计(NTKDE) 基于网络的模型在预测精度及效果上明显强于基于平面的模型[72] Rosser等[72] 2017
NTKDE
门控局部扩散网络模型(GLDNet)
门控局部扩散网络模型预测效果优于基于网络的时空核密度估计模型[72,74,76] Zhang等[72,74,76] 2019
(2)时空搜索窗模型
时空搜索窗模型是利用路网数据基于搜索窗口的平滑作用来捕获犯罪的时空模式,与图传播模型不同的是,时空搜索窗模型完全依赖于历史数据中的模式进行预测[72]。这类模型的代表为Shiode等[77,78,79]在2011—2015年提出的基于网络的利用搜索窗(Search Window)技术进行的犯罪时空分析系列模型(表4)。这类模型的核心思想是把基于平面的时空计算转换为基于路网的时空计算,对于时空模式的识别则通过搜索窗进行。图4展示了空间搜索窗(ws)、时间搜索窗(wt)和时空搜索窗(wst)的具体形式,每一个搜索窗都各自通过路网(Ns)、时空网络(Nst)以及研究区域的时间范围(Nt)进行时空热点的搜索。
表4 时空搜索窗模型及其预测效果

Tab. 4 The methods adopted by the search window model and theirs prediction effect

方法 预测效果 提出/使用者 研究时间/年
基于网络的犯罪时空分析
(NT-STAC)
基于网络的空间扫描统计
(NT-SaTScan)
其他条件相同情况下,基于网络的方法总体强于基于平面的方法[77] Shiode等[77] 2011
基于网络的空间搜索窗犯罪时空分析模型(SNT-STAC)
基于网络的时空搜索窗犯罪时空分析模型(STNT-STAC)
其他条件相同情况下,预测效果上,基于时空的模型优于基于空间的模型[78] Shiode等[78] 2013
时间搜索窗犯罪分析模型(TAC)
基于网络的犯罪空间搜索窗分析模型(SACNT
基于网络的犯罪时空搜索窗分析模型(STACNT
其他条件相同情况下,基于网络的方法总体强于基于平面的方法;其他条件相同情况下,在预测效果上,基于时空的模型优于基于空间的模型优于基于时间的模型[79] Shiode等[79] 2015
图4 基于网络的搜索窗模型示意[79]

Fig. 4 Principle of network-based search window model

通过时空搜索窗(wst)发现x起犯罪事件的概率定义为:
P X wst = x = e - λ λ x x ! , x = 0,1 , , n
λ = nq = n | w st | N st
式中:Xwst是落在时空搜索窗内的案件数量,是一个独立泊松随机变量;λ是案件落在wst中的期望值。利用时空搜索窗进行犯罪预测是在wst中至少观察到x次犯罪事件的累积概率的大小,该累积概率定义为:
P X wst x = 1 - P X wst < x = 1 - i = 0 x - 1 e - λ λ i i !
这些模型除了验证了基于网络的计算方式相比基于平面的计算方式具有一定的优越性以外,还验证了时空计算相比只用时间或者空间单一维度计算能发现更多潜在的犯罪时空热点。
总的来看,从应用范围方面来看,输入变量为空间栅格数据的预测模型在犯罪时空预测领域的应用最广,模型的种类最多。从预测精度来看,基于矩阵/张量分解的模型具有较为理想的预测效果,一方面,相比其他模型,该模型的复杂度更高、可拓展性更强,在数据量较大的场景下能有更好的表现;另一方面,矩阵/张量分解模型融合多源异构信息的能力更高。总之,基于时空环境要素的犯罪时空预测相比单纯基于案件时空位置信息的犯罪时空预测进一步考虑了背景环境对犯罪生成及演化的时空效应,除了可以识别历史高风险区的犯罪模式,还可以在尚未出现犯罪的区域检测出潜在风险。理论上,基于时空环境要素的犯罪时空预测也可以解决宏观趋势统计分析的相关需求,但是它更适用于已获得基础背景环境数据的中长期趋势时空预测场景,即决定近几个月或几周的警力部署、巡控方案和专项打击等。

4.3 融合行为轨迹和时空环境要素的犯罪时空预测

这一类犯罪时空预测方法主要采用了基于回归的建模方式,相关的模型主要有利用负二项回归、离散选择以及其他传统机器学习算法对行为轨迹数据和时空环境要素数据进行建模来预测犯罪的时空分布(表5)。
表5 不同研究人员所采用的输入变量、模型、对比形式及预测效果

Tab. 5 The input variables, models, comparative forms and predictive effects used by different researchers

输入变量 模型 对比形式 效果 提出/使用者 研究时间/年
案件:犯罪数据
时空静态类:POI数据
时空动态类:浮动车数据
线性回归模型
负二项回归模型
GWNBR
模型间对比 基于地理加权回归的负二项回归模型效果最佳[85] Wang等[84]
Wang等[85]
2016
2017
案件:犯罪数据
时空静态类:POI数据
时空动态类:签到数据
负二项回归模型
线性回归模型
随机森林模型
模型间对比 随机森林模型预测效果最佳[86] Shakila Khan Rumi等[86] 2019
案件:盗窃案件数据
时空静态类:POI数据
空间静态时间动态类:基站信令数据
离散选择模型 是否增加非时空静态类数据 增加非时空静态类数据可以提升预测精度[80] Song等[80] 2019
案件:侵财类案件数据
时空静态类:警务对策数据、土地利用数据、人口普查数据、经济普查数据
空间静态时间动态类:流动人口数据
BP神经网络模型
GA-BP神经网络模型
模型间对比 改进的GA-BP模型预测效果更佳[87] Li等[87] 2017
案件:单类犯罪数据、公共服务投诉数据
空间静态时间动态类:气象数据
时空动态类:浮动车数据、POI签到数据
TCP
CSI
ARMA
LASSO
线性回归模型
时空多任务学习模型
模型间对比 TCP能取得最优预测效果[83] Zhao等[83] 2017
案件:警情数据
时空静态类:人口网格数据
空间静态时间动态类:基站信令数据
时空动态类:浮动车数据、地铁刷卡数据
负二项回归模型 是否增加非时空静态类数据 增加非时空静态类数据可以提升预测精度[81] Song等[81] 2018
案件:多种类犯罪案件数据
时空静态类:人口统计数据
空间静态时间动态类:场馆使用数据
时空动态类:浮动车数据、地铁刷卡数据
随机森林模型
梯度提升模型
Extra-Tree模型
不同数据对结果作用效果对比;模型间对比 不同类型案件对增加非时空静态类数据的敏感度不同,但都能提升预测效果;不同犯罪类型预测并没有一个完全最优的模型[82] Kadar等[82] 2018
该类模型一般采用2种方式表征这种数据中的动态性。① 直接将时间属性作为特征,再利用特征工程提取更加复杂的特征来增强对时空特性的表征。研究发现,在案件时空位置信息和时空环境要素数据的基础上增加人类活动产生的非时空静态类感知要素后可以显著提升预测精度[80,81],但不同犯罪类型对非时空静态类感知要素的敏感程度并不相同,因此提升效果不一,有些类型的犯罪在加入后还可能降低预测精度[82]。另外,不同犯罪类型的犯罪模式存在一定的区别,因此在一种犯罪类型上预测效果最佳的模型并不一定适用于其他类型的犯罪[82]。② 改变模型内部的算法,如设计适用于进行时序模式识别的模型,或者通过获取时空上的行为关联利用图相关算法来进行预测,这种处理方式在特征工程上使用了相对复杂的操作,此外还对模型进行了较大的变动。比如基于矩阵/张量分解的方法构建可以融合时空动态轨迹的预测框架[83],考虑到潜在目标的流动性,除了提取时空动态轨迹的相关特征作为新的输入变量[84,85],也可以对现有的回归类模型进行改进[85,86,87]
相比于基于案件时空位置信息和基于时空环境要素的犯罪时空预测方法,融合行为轨迹和时空环境要素的犯罪时空预测进一步考虑了在背景环境限制下主体(罪犯和受害者)在时空上的流动性,更大程度还原了现实中犯罪的生成和演化机制。其中时空环境要素可以表征空间效应,主体行为要素可以表征时空综合效应。相比前2种犯罪时空预测方法能更好地表现出犯罪与时空之间的关联,因此能适应于微观尺度的犯罪时空趋势预测,适合于解决短期的犯罪热点生成或演化、犯罪时空风险的精准化预测等问题。

5 结论与展望

5.1 结论

近年来,犯罪时空预测经历了快速的发展,不仅表现为输入的数据从简单的案事件时空信息到包含时空场景特征和个体行为特征的多源时空数据,预测的模型和算法从简单的线性模型发展到非线性模型,更主要的表现为预测的效果日益的精细化和精准化。目前,按照输入数据的类型,犯罪时空预测大体可分为3种类型,即基于案件时空位置信息的犯罪时空预测、基于时空环境要素的犯罪时空预测和融合行为轨迹和时空环境要素的犯罪时空预测,但每一种犯罪时空预测所服务的对象和解决的问题是不同的。其中基于案件时空位置信息的犯罪时空预测主要服务于警务资源的一般性优化和部署,基于时空环境要素的犯罪时空预测在解释性上稍好,因此能够服务于警务资源的精细化优化部署,并能够服务于治安态势的防控等工作,而融合行为轨迹和时空环境要素的犯罪时空预测则在精细化时空尺度下还原了犯罪活动的生成和演化机制,因此适用于解决犯罪活动的精准化时空预测和战术性犯罪防控等工作。随着大数据技术的发展,可以预见到,未来犯罪时空预测的输入数据势必会越来越多,对多源数据的分析、处理、拟合、输出模型也会更为复杂,但无论犯罪时空预测如何发展,其都需要在明确服务的目标和对象的基础上来合理的组织数据输入和选择合适的模型算法才能达到较好的应用效果。因此,本文对犯罪时空预测研究的分析和总结能够从一定程度上有助于该领域的进一步发展和完善。

5.2 展望

总体来看,犯罪时空预测是一个复杂的交叉应用领域,在预测准确性、可靠性以及方法的可迁移性等方面仍面临着较多的问题。结合近年来的大数据技术以及数据科学的发展趋势,本文认为未来犯罪时空风险预测需要在输入数据的完善和预测模型的优化2个方面进行进一步提升。
(1)输入数据的完善
大数据技术的快速发展使人们能够接触到维度更高、特征更全、实时性更强的数据,因此,未来的犯罪时空预测方法的输入数据必须要适应大数据场景下数据的动态性、泛在性、全类型和全关系的特性,方能实现对犯罪风险的实时感知、快速反应和精准预测[88],而要达到这一目标需要在犯罪时空风险预测的输入数据方面进行相应的完善。
① 融合体系的构建。在大数据时代下,数据呈现出显著的多源异构特性,不同的数据来源不仅意味着数据的采集目的和采集方式的不同,对于犯罪事件的表征所起到的作用也是不同的。因此数据治理的过程需要相关理论进行支撑以形成一套科学的体系架构,以科学地组织可供模型融合的变量。近年来知识图谱的兴起为数据融合和知识化提供了很好的基础,构建适用于犯罪时空预测的知识图谱或有助于探索和解释影响犯罪生成和演化的要素。
② 数据粒度的细化。环境犯罪学理论认为犯罪生成和演化与罪犯的认知空间存在紧密的联系,同时还与不同时空环境下的犯罪成本有关。综合现有的研究来看,大部分集中在宏观和中观尺度的要素分析。而大量的实证研究则表明,城市建成环境的微观特征在诱发和抑制犯罪中具有重要作用。大数据技术的发展使得这一微观尺度下的要素数据的获取得以解决,微观尺度的数据不仅能反映时空环境对人群吸引聚集的能力,也可以隐式地建立数据中犯罪相关要素与犯罪成本之间的关联,相比宏观和中观尺度下的数据可能更有助于犯罪时空预测效果的提升,具有更高的可解释性。
③ 新型数据的探索融合。虚拟世界信息传播对现实世界的影响日益深入,这种超越地理时空的作用对当前的犯罪时空预测提出了巨大挑战。网络社交媒体的出现使得信息的传播更加迅捷,越来越多基于社交媒体的新型犯罪手法开始涌现,犯罪模式已经开始明显发生变化。因此,重新定义或重构犯罪模式理论中的认知空间(Awareness Space),在主体行为、案件信息和时空环境的传统数据基础上,进一步考虑主体的社会关系和社交行为数据,以更好地进行犯罪时空预测,或将成为大数据和人工智能时代犯罪时空预测一个发展的新方向。
(2)预测模型的优化
犯罪时空预测模型的发展一方面取决于需求场景,另一方面取决于输入的数据。大数据时代下,数据的数量、类型、精细程度都存在不同程度的提升,这就对模型的计算、拟合、同化等能力提出了挑战,在未来的犯罪时空预测中需要着重解决预测模型的2个关键问题:
① 对多类型数据的融合能力。某种程度上,单一类型数据可以在其自身适用的观测尺度下有效地表征和犯罪事件相关的信息,但是将多个相关的要素统一到相同的观测尺度下并在信息损失最少的情况下融合多种类型数据,对大部分现有的犯罪时空预测方法提出了较大的挑战。这一问题随着人工智能技术的发展已经有了较好的解决,人工智能技术的核心之一就是机器学习算法,这种算法需要大量的样本进行训练,非常适合大数据场景下的数据融合。在犯罪时空预测领域,基于机器学习算法对多类型数据进行融合的研究仍处于探索之中,在未来需要强化和提出面向不同类型数据、具有较好的融合能力的算法模型,以达到适应大数据场景的犯罪时空预测目标。
② 预测效果与可解释性之间的平衡。机器学习算法在犯罪时空预测领域的应用使得预测效果得到了明显地提升。但相比非机器学习的算法,模型的可解释性则显著下降,输入数据与犯罪活动之间的关联变得不再显著。可解释性不但对于决策有很大的影响,对于后期模型的优化也具有不可忽视的作用。知识图谱技术的兴起为大数据场景下的溯源分析提供了新的思路,知识图谱是基于专家经验的结构化显式知识,机器学习算法则具有高效的数据融合能力和推理能力。因此,未来如何利用新技术在提升预测效果的前提下进一步提高方法的可解释性是犯罪时空预测面临的另一个重要挑战之一。
[1]
Perry W L . Predictive policing: The role of crime forecasting in law enforcement operations[M]. Rand Corporation, 2013.

[2]
Ratcliffe J . What is the futureof predictive policing[J]. Practice, 2015,6(2):151-166.

[3]
魏平雄, 赵宝成, 王顺安 . 犯罪学教程[M]. 北京: 中国政法大学出版社, 1998.

[ Wei P X, Zhao B C, Wang A S. The criminology tutorial[M]. Beijing: China University of Political Science and Law Press, 1998.]

[4]
Hardyns W, Rummens A . Predictive policing as a new tool for law enforcement? Recent developments and challenges[J]. European Journal on Criminal Policy and Research, 2018,24(3):201-218.

DOI

[5]
Sherman L W, Gartin P R, Buerger M E . Hot spots of predatory crime: Routine activities and the criminology of place[J]. Criminology, 1989,27(1):27-56.

DOI

[6]
Farrell G, K Pease . Once Bitten, Twice Bitten: Repeat Victimisation and Its Implications for Crime Prevention[M]. London: Police Research Group, 1993.

[7]
Clarke R V, Cornish D B . Modeling offenders' decisions: A framework for research and policy[J]. Crime and Justice, 1985,6:147-185.

DOI

[8]
Cohen L E, Felson M . Social change and crime rate trends: A routine activity approach[J]. American Sociological Review, 1979,44(4):588-608.

DOI

[9]
Clarke R V, Cornish D B. Crime control in Britain: A review of policy research[M]. New York: SUNY Press, 1983.

[10]
Brantingham P J, Brantingham P L . Environmental criminology[M]. Beverly Hills, C A: Sage Publications, 1981.

[11]
Brantingham P L, Brantingham P J . Nodes, paths and edges: Considerations on the complexity of crime and the physical environment[J]. Journal of Environmental Psychology, 1993,13(1):3-28.

DOI

[12]
李国军 . 预测警务的理论基础与技术路径研究[J]. 湖北警官学院学报, 2016,29(5):79-86.

[ Li G J . Research on theoretical basis and technical path of predictive policing[J]. Journal of Hubei University of Police, 2016,29(5):79-86.]

[13]
Richard Wortley, Michael Townsley . Environmental criminology and crime analysis[M]. New York: Taylor& Francis, 2016.

[14]
Polvi N, Looman T, Humphries C , et al. The time course of repeat burglary victimization[J]. The British Journal of Criminology, 1991,31(4):411-414.

DOI

[15]
Townsley M, Homel R, Chaseling J . Infectious burglaries. A test of the near repeat hypojournal[J]. British Journal of Criminology, 2003,43(3):615-633.

DOI

[16]
ChaineyS, Ratcliffe J . Identifying crime hotspots[M]. England: John Wiley & Sons Ltd, 2013.

[17]
Kalinic M, Krisp J M. Kernel Density Estimation (KDE) vs. hot-spot analysis-detecting criminal hot spots in the city of San Francisco [C]. Proceeding of the 21 Conference on Geo-Information Science, 2018.

[18]
Bowers K J, Johnson S D, Pease K . Prospective hot-spotting: the future of crime mapping?[J]. British Journal of Criminology, 2004,44(5):641-658.

DOI

[19]
徐冲, 柳林, 周素红 . 基于临近相似性考虑的犯罪热点密度图预测准确性比较——以DP半岛街头抢劫犯罪为例[J]. 地理科学, 2016,36(1):55-62.

DOI

[ Xu C, Liu L, Zhou S H . The comparison of predictive accuracy of crime hotspot density maps with the consideration of the near similarity:acase study of robberies at DP peninsula[J]. Scientia Geographica Sinica, 2016,36(1):55-62.]

[20]
Daley D J, Vere-Jones D . An introduction to the theory of point processes[M]. New York: Springer, 2003.

[21]
Zhuang J . Second order residual analysis of spatiotemporal point processes and applications in model evaluation[J]. Journal of the Royal Statistical Society: Series B (Statistical Methodology), 2006,68(4):635-653.

DOI

[22]
Marsan D, Lengline O . Extending earthquakes' reach through cascading[J]. Science, 2008,319(5866):1076-1079.

DOI PMID

[23]
Mohler G O, Short M B, Brantingham P J , et al. Self-exciting point process modeling of crime[J]. Journal of the American Statistical Association, 2011,106(493):100-108.

DOI

[24]
D'Orsogna M R, Perc M . Statistical physics of crime: A review[J]. Physics of Life Reviews, 2015,12:1-21.

DOI PMID

[25]
Olligschlaeger A M . Artificial neural networks and crime mapping[J]. Crime Mapping and Crime Prevention, 1997,8(3):313-348.

[26]
Corcoran J J, Wilson I D, Ware J A . Predicting the geo-temporal variations of crime and disorder[J]. International Journal of Forecasting, 2003,19(4):623-634.

DOI

[27]
Gorr W L, Lee Y J . Early warning system for temporary crime hot spots[J]. Journal of Quantitative Criminology, 2015,31(1):25-47.

DOI

[28]
柳林, 刘文娟, 廖薇薇 , 等. 基于随机森林和时空核密度方法的不同周期犯罪热点预测对比[J]. 地理科学进展, 2018,37(6):25-35.

[ Liu L, Liu W J, Liao W W , et al. Comparison of random forest algorithm and space-time kernel density mapping for crime hotspot prediction[J]. Progress in Geography, 2018,37(6):761-771.]

[29]
柳林, 纪佳楷, 宋广文 , 等. 基于犯罪空间分异和建成环境的公共场所侵财犯罪热点预测[J]. 地球信息科学学报, 2019,21(11):1655-1668.

[ Liu L, Ji J K, Song G W , et al. Hotspot prediction of public property crime based on spatial differentiation of crime and built environment[J]. Journal of Geo-information Science, 2019,21(11):1655-1668.]

[30]
Duan L, Hu T, Cheng E , et al. Deep convolutional neural networks for spatiotemporal crime prediction[C]. Proceedings of the International Conference on Information and Knowledge Engineering (IKE). The Steering Committee of The World Congress in Computer Science, Computer Engineering and Applied Computing (WorldComp), 2017.

[31]
Stec A, Klabjan D . Forecasting crime with deep learning[J]. arXiv preprint arXiv:1806.01486, 2018.

[32]
Yi F, Yu Z, Zhuang F , et al. Neural network based continuous conditional random field for fine-grained crime prediction [C]. Proceedings of the Twenty-Eighth International Joint Conference on Artificial Intelligence, IJCAI, 2019.

[33]
Cortez B, Carrera B, Kim Y J , et al. An architecture for emergency event prediction using LSTM recurrent neural networks[J]. Expert Systems with Applications, 2018,97(1):315-324.

[34]
沈寒蕾, 张虎, 张耀峰 , 等. 基于长短期记忆模型的入室盗窃犯罪预测研究[J]. 统计与信息论坛, 2019,34(11):107-115.

[ Shen H L, Zhang H, Zhang Y F , et al. Prediction of burglary crime based on LSTM[J]. Statistics & Information Forum, 2019,34(11):107-115.]

[35]
Wortley R K, Mazerolle L A . Environmental criminology and crime analysis: situating the theory, analytic approach and application[J]. Crime Prevention & Community Safety, 2009,11(2):1-15.

[36]
陈鹏, 李欣, 胡啸峰 , 等. 北京市长安街沿线的扒窃案件高发区分析及防控对策[J]. 地理科学进展, 2015,34(10):1250-1258.

[ Chen P, Li X, Hu X F , et al. Clustering pattern analysis and prevention strategies to pickpocketing offence along the Chang'an Street in Beijing[J]. Progress In Geography, 2015,34(10):1250-1258.]

[37]
Caplan J M, Kennedy L W . Risk terrain modeling manual: Theoretical framework and technical steps of spatial risk assessment for crime analysis[M]. New Jersey: Rutgers Center on Public Security, 2010.

[38]
Kennedy L W, Caplan J M, Piza E . Risk clusters, hotspots, and spatial intelligence: Risk terrain modeling as an algorithm for police resource allocation strategies[J]. Journal of Quantitative Criminology, 2011,27(3):339-362.

[39]
张宁, 王大为 . 基于风险地形建模的毒品犯罪风险评估和警务预测[J]. 地理科学进展, 2018,37(8):1131-1139.

[ Zhang N, Wang D W . Drug-related crime risk assessment and predictive policing based on risk terrain modeling[J]. Progress in Geography, 2018,37(8):1131-1139.]

[40]
Fotheringham A S, Rogerson P A . The SAGE handbook of spatial analysis[M]. New York: Sage, 2009.

[41]
Cohen J, Nagin D, Wallstrom G , et al. Hierarchical bayesian analysis of arrest rates[J]. Journal of the American Statistical Association, 1998,93(444):1260-1270.

[42]
Berry D A, Evett I W, Pinchin R . Statistical inference in crime investigations using deoxyribonucleic acid profiling[J]. Applied Statistics, 1992,41(3):499-531.

[43]
Law J, Haining R . A Bayesian approach to modeling binary data: The case of high-intensity crime areas[J]. Geographical Analysis, 2004,36(3):197-216.

[44]
Wheeler D C, Waller L A . Comparing spatially varying coefficient models: a case study examining violent crime rates and their relationships to alcohol outlets and illegal drug arrests[J]. Journal of Geographical Systems, 2009,11(1):1-22.

[45]
Law J, Quick M . Exploring links between juvenile offenders and social disorganization at a large map scale: A Bayesian spatial modeling approach[J]. Journal of Geographical Systems, 2013,15(1):89-113.

[46]
Marchant R, Haan S, Clancey G , et al. Applying machine learning to criminology: semi-parametric spatial-demographic Bayesian regression[J]. Security Informatics, 2018,7(1):1-19.

[47]
Law J, Quick M, Chan P . Bayesian spatio-temporal modeling for analysing local patterns of crime over time at the small-area level[J]. Journal of Quantitative Criminology, 2014,30(1):57-78.

[48]
Hu T, Zhu X, Duan L , et al. Urban crime prediction based on spatio-temporal Bayesian model[J]. PloS One, 2018,13(10):1-18.

[49]
何晓群 . 现代统计分析方法与应用[M]. 北京: 中国人民大学出版社, 2016.

[ He X Q. Modern statistical analysis methods and applications[M]. Beijing: China Renmin University Press, 2016.]

[50]
Bernasco W, Nieuwbeerta P . How do residential burglars select target areas? A new approach to the analysis of criminal location choice[J]. British Journal of Criminology, 2005,45(3):296-315.

[51]
Bernasco W, Block R . Where offenders choose to attack: A discrete choice model of robberies in Chicago[J]. Criminology, 2009,47(1):93-130.

[52]
Bernasco W . Modeling micro-level crime location choice: Application of the discrete choice framework to crime at places[J]. Journal of Quantitative Criminology, 2010,26(1):113-138.

[53]
Baudains P, Braithwaite A, Johnson S D . Target choice during extreme events: A discrete spatial choice model of the 2011 London riots[J]. Criminology, 2013,51(2):251-285.

[54]
Picasso E, Cohen M A . Valuing the public's demand for crime prevention programs: A discrete choice experiment[J]. Journal of Experimental Criminology, 2019,15(4):529-550.

[55]
Ge L, Liu J, Zhou A , et al. Crime rate inference using tensor decomposition [C]. Guangdong: IEEE, 2018.

[56]
Kolda T G, Bader B W . Tensor decompositions and applications[J]. SIAM Review, 2009,51(3):455-500.

[57]
段炼, 党兰学, 胡涛 , 等. 融合历史犯罪数据的疑犯社会活动位置预测[J]. 地球信息科学学报, 2018,20(7):929-938.

[ Duan L, Dang L X, Hu T , et al. Mobility prediction of suspect based on historical crime records[J]. Journal of Geo-information Science, 2018,20(7):929-938.]

[58]
Rummens A, Hardyns W, Pauwels L . The use of predictive analysis in spatiotemporal crime forecasting: building and testing a model in an urban context[J]. Applied Geography, 2017,86(1):255-261.

[59]
Huang C, Zhang J, Zheng Y , et al. DeepCrime: Attentive hierarchical recurrent networks for crime prediction [C]. Torino: Proceedings of the 27 th ACM International Conference on Information and Knowledge Management , 2018.

[60]
Wang B, Luo X, Zhang F , et al. Graph-based deep modeling and real time forecasting of sparse spatio-temporal data[J]. ArXiv Preprint ArXiv: 1804.00684, 2018.

[61]
潘仲赢 . 基于机器学习算法的犯罪预警系统设计与实现[D]. 成都:电子科技大学, 2019.

[ Pan Z Y . Design and implementation of crime early warning system based on machine learning algorithm[D]. Chendu: University of Electronic Science and Technology of China, 2019.]

[62]
Bevis C, Nutter J B . Changing street layouts to reduce residential burglary[M]. Minnesota: Minnesota Crime Prevention Center, 1977.

[63]
Beavon D J K, Brantingham P L, Brantingham P J . The influence of street networks on the patterning of property offenses[J]. Crime Prevention Studies, 1994,2:115-148.

[64]
Shu S, Huang J . Spatial configuration and vulnerability of residential burglary: A case study of a city in Taiwan [C]. London: International Space Syntax Symposium, 2003.

[65]
Davies T, Johnson S D . Examining the relationship between road structure and burglary risk via quantitative network analysis[J]. Journal of Quantitative Criminology, 2015,31(3):481-507.

[66]
Hillier B, Shu S C . Crime and urban layout: the need for evidence [C]. London: IPPR, 2000.

[67]
Hillier B . Can streets be made safe?[J]. Urban Design International, 2004,9(1):31-45.

[68]
Hillier B, Sahbaz O . An evidence based approach to crime and urban design, or, can we have vitality, sustainability and security all at once[R]. London:Routledge, 2008.

[69]
Johnson S D, Bowers K J . Permeability and burglary risk: are cul-de-sacs safer?[J]. Journal of Quantitative Criminology, 2010,26(1):89-111.

[70]
Summers L, Johnson S D . Does the configuration of the street network influence where outdoor serious violence takes place? using space syntax to test crime pattern theory[J]. Journal of Quantitative Criminology, 2017,33(2):397-420.

[71]
Kim H J, Choi Y . A study on the influence of the space syntax and the urban characteristics on the incidence ofcrime using negative binomial regression[J]. Journal of The Korean Society of Civil Engineers, 2016,36(2):333-340.

[72]
Rosser G, Davies T, Bowers K J , et al. Predictive crime mapping: arbitrary grids or street networks?[J]. Journal of Quantitative Criminology, 2017,33(3):569-594.

PMID

[73]
Davies T P, Bishop S R . Modelling patterns of burglary on street networks[J]. Crime Science, 2013,2(1):1-14.

[74]
Zhang Y, Cheng T . Graph deep learning model for network-based predictive hotspot mapping of sparse spatio-temporal events[J]. Computers, Environment and Urban Systems, 2020,79(1):1-12.

[75]
Lu Y, Chen X . On the false alarm of planar K-function when analyzing urban crime distributed along streets[J]. Social Science Research, 2007,36(2):611-632.

[76]
Godwin A, Stasko J T . Nodes, paths, and edges: using mental maps to augment crime data analysis in urban spaces [C]. Barcelona: Eurographics/IEEE VGTC Conference on Visualization, 2017.

[77]
Shiode S . Street-level spatial scan statistic and STAC for analysingstreet crime concentrations[J]. Transactions in GIS, 2011,15(3):365-383.

[78]
Shiode S, Shiode N . Network-based space-time search-window technique for hotspot detection of street-level crime incidents[J]. International Journal of Geographical Information Science, 2013,27(5):866-882.

[79]
Shiode S, Shiode N, Block R , et al. Space-time characteristics of micro-scale crime occurrences: an application of a network-based space-time search window technique for crime incidents in Chicago[J]. International Journal of Geographical Information Science, 2015,29(5):697-719.

[80]
Song G, Bernasco W, Liu L , et al. Crime feeds on legal activities: daily mobility flows help to explain thieves’ target location choices[J]. Journal of Quantitative Criminology, 2019,35(4):831-854.

[81]
Song G, Liu L, Bernasco W , et al. Testing indicators of risk populations for theft from the person across space and time: the significance of mobility and outdoor activity[J]. Annals of the American Association of Geographers, 2018,108(5):1370-1388.

[82]
Kadar C, Pletikosa I . Mining large-scale human mobility data for long-term crime prediction[J]. EPJ Data Science, 2018,7(1):1-27.

DOI

[83]
Zhao X, Tang J . Modeling temporal-spatial correlations for crime prediction [C]. New York: Proceedings of the 2017 ACM on Conference on Information and Knowledge Management, 2017.

[84]
Wang H, Kifer D, Graif C , et al. Crime rate inference with big data [C]. San Francisco, Calif: Proceedings of the 22nd ACM SIGKDD international conference on knowledge discovery and data mining. 2016: 635-644.

[85]
Wang H, Yao H, Kifer D , et al. Non-stationary model for crime rate inference using modern urban data[J]. IEEE Transactions on Big Data, 2017,5(2):180-194.

DOI PMID

[86]
Rumi S K, Luong P, Salim F D . Crime rate prediction with region risk and movement patterns[J]. arXiv preprint arXiv: 1908.02570, 2019.

[87]
李卫红, 闻磊, 陈业滨 . 改进的GA-BP神经网络模型在财产犯罪预测中的应用[J]. 武汉大学学报·信息科学版, 2017,42(8):1110-1116,1171.

[ Li H W, Wen L, Chen Y B . Property crime forecast based on improved GA-BP neural network model[J]. Geomatics and Information Science of Wuhan University, 2017,42(8):1110-1116,1171.]

[88]
徐志刚 . 专论:公安大数据应用期待观念更新[J]. 人民公安, 2019,68(10):13-13.

[ Xu Z G . Characteristic analysis of police big data[J]. People's Police, 2019,68(10):13-13.]

Outlines

/