地理空间分析综合应用

不同人口流动模式下城市传染病时空传播模型适用性研究

  • 薛山 , 1, 2 ,
  • 廖一兰 , 1, * ,
  • 李春林 1, 2 ,
  • 胡艺 3, 4, 5
展开
  • 1.中国科学院地理科学与资源研究所 资源与环境信息系统国家重点实验室,北京 100101
  • 2.中国科学院大学资源与环境学院,北京 100049
  • 3.复旦大学公共卫生学院流行病学与卫生统计学系,上海 200032
  • 4.教育部公共卫生安全重点实验室,上海 200032
  • 5.复旦大学公共卫生学院空间分析与建模实验室,上海 200032
*廖一兰(1980— ),女,湖南邵阳人,副研究员,主要从事空间数据挖掘等方面的研究。E-mail:

薛山(1997— ),男,山东临沂人,硕士生,主要从事空间流行病学等方面的研究。E-mail:

收稿日期: 2022-04-25

  修回日期: 2022-08-08

  网络出版日期: 2023-03-25

基金资助

国家自然科学基金项目(42171419)

Research on the Applicability of Urban Infectious Disease Spatiotemporal Transmission Model Under Different Population Flow Patterns

  • XUE Shan , 1, 2 ,
  • LIAO Yilan , 1, * ,
  • LI Chunlin 1, 2 ,
  • HU Yi 3, 4, 5
Expand
  • 1. State Key Laboratory of Resources & Environmental Information System, Institute of Geographic Sciences & Natural Resources Research, Chinese Academy of Sciences, Beijing 100101, China
  • 2. College of Resources and Environment, University of Chinese Academy of Sciences, Beijing 100049, China
  • 3. Department of Epidemiology and Biostatistics, School of Public Health, Fudan University, Shanghai 200032, China
  • 4. Key Laboratory of Public Health Safety, Ministry of Education, Shanghai 200032, China
  • 5. Laboratory for Spatial Analysis and Modeling, School of Public Health, Fudan University, Shanghai 200032, China
*Liao Yilan, E-mail:

Received date: 2022-04-25

  Revised date: 2022-08-08

  Online published: 2023-03-25

Supported by

Foundation item: National Natural Science Foundation of China(42171419)

摘要

空间显式传染病传播模型由于能够较好地模拟城市内部的传染病传播过程,在城市疫情防控中得到了广泛应用。但现有的空间显式模型大多按照人口随机流动模式来模拟城市人口流动行为,未考虑城市中以通勤为主的人口流动模式。本文以长沙市的2014年第1~49周手足口病传播过程为例,将4、8、24邻域扩散以及重力模型、辐射模型共5种不同的人口流动模式与周期SEIR动力学模型结合建立起五种传染病传播模型,并通过比较模型时间和空间精度来明确不同人口流动模式应用在城市内传染病时空传播模拟中的各自优势和适用范围。实验结果表明:每种人口流动模式在城市内传染病时空传播模拟中都有其使用前提和适用范围。基于24邻域扩散的传播模型对手足口病病例数拟合精度最高( R M S E s p a t i a l _ t s =0.58, R M S E s p a t i a l _ s t =0.95),基于重力模型的传播模型对城市内部传染病时空传播模拟中的传播趋势的模拟精度最高( r s p a t i a l _ t s=0.46, r s p a t i a l _ s t=0.39),且对长沙市人口相对稠密区域(格网常住人口数大于第三四分位数区域)模拟具有显著的精度优势( r s p a t i a l _ t s=0.55, R M S E s p a t i a l _ t s=0.92),但在疫情早期对手足口病未来传播的预测能力上较差。基于辐射模型的传播模型作为无参数模型,虽然整体时空精度上表现欠佳,但在人口稠密区域显现出较好的拟合效果( r s p a t i a l _ t s=0.50, R M S E s p a t i a l _ t s=1.0),在五种模型中具有最佳的手足口病传播预测能力。

本文引用格式

薛山 , 廖一兰 , 李春林 , 胡艺 . 不同人口流动模式下城市传染病时空传播模型适用性研究[J]. 地球信息科学学报, 2023 , 25(1) : 208 -222 . DOI: 10.12082/dqxxkx.2023.220221

Abstract

The spatially explicit infectious disease transmission model has been widely used in urban epidemic prevention and control since it can better simulate the transmission processes of infectious diseases in cities. However, most of the existing spatially explicit models simulate the flow behavior of urban population based on the random population flow pattern, and do not consider the commuting-based population flow pattern in the city. Taking the Hand, Foot, and Mouth Disease (HFMD) transmission process in Changsha city from the 1st to the 49th week of 2014 as an example, this paper combines periodic SEIR dynamic models with five different population flow models including 4, 8, 24 adjacent diffusion models, gravity model, and radiation model. Thus, five infectious disease transmission models are formed, and the respective advantages and applicable scope of different transmission models are clarified by comparing their temporal and spatial accuracy. The experimental results show that each model has its premise and scope of application. The transmission model based on 24-neibor diffusion has the highest fitting accuracy of the number of HFMD cases ( R M S E s p a t i a l _ t s =0.58, R M S E s p a t i a l _ s t = 0.95). The model based on gravity model achieves the highest accuracy in simulating the transmission trend of HFMD in Changsha ( r s p a t i a l _ t s=0.46, r s p a t i a l _ s t=0.39), with even higher simulation accuracy in the relatively densely populated areas in Changsha (the grid resident population is greater than the third quartile area) ( r s p a t i a l _ t s=0.55, R M S E s p a t i a l _ t s=0.92). But its prediction ability of HFMD transmission in the early stage of HFMD epidemic is poor. The transmission model based on the radiation model is a parameter-free model, although its overall spatial-temporal accuracy is not high, it shows a good fitting effect in densely populated areas ( r s p a t i a l _ t s=0.50, R M S E s p a t i a l _ t s=1.04) and has the best HFMD transmission prediction ability among the five models.

1 引言

传染病对人类生命健康安全具有重大威胁,自21世纪初在全球范围内每年造成至少150万人死亡[1],流感、疟疾和霍乱等传染病的爆发可以在短时间内造成数万人的死亡[2]。城市作为人口密度最高、交通最便捷的地区,为传染病的传播提供了有利的条件,成为传染病爆发的高危地区。由于城市的交通便利性,病毒更有可能随着人口流动从起始爆发地首先到达城市[3],而城市内部较高的人口密度,便利的公共交通系统、较高的接触率和暴露率等因素进一步促进了传染病的传播[4]。例如在严重急性呼吸道综合征(SARS)、甲型H1N1流感的流行中,人口稠密的城市成为了新发传染病传播的温床[5]。因此,探索城市传染病的传播过程,根据城市的特点采取有效的防控措施,对城市的传染病防控具有重要意义。
以SIR、SEIR为首的传统仓室模型[6](Compartmental Model)在过去数十年中已经在传染病传播过程的模拟中得到了广泛的应用,但由于其采用同质性假设,无法适用于具有复杂空间和群体结构的现实世界人群中[7]。根据模型中模拟对象的不同,可以将模拟传染病传播的仓室模型分为2类[8]: ①基于集合种群[9]的模型考虑到在现实世界中人群分布往往表现出分片分区的特点,在建模时将子群体作为模拟的基本单位;②基于个体的模型(Individual Dased Model, IBM)以个体为基本单位,从微观层次通过构建接触网络来模拟传染病的传播。而根据建模方法的不同,仓室模型又可以分为:①微分方程模型[10],该类模型用时间的微分方程来表示每个仓室中人群数量随着时间的变化,从而模拟传染病的传播过程;②元胞自动机(Cellular Automata, CA)模型[11]则没有固定的数学公式,将空间和时间划分为离散的元胞和迭代步数,并定义了元胞的流行病学状态和邻域,而元胞状态的演化(传染病的传播)则依赖于定义的元胞状态转移规则和元胞与邻域之间的相互作用[12];③智能体模型[13](Agent Based Model, ABM),这类传染病模型由智能体、环境和智能体行为规则3部分组成,作为模拟的个体,智能体能够根据感知到的环境信息,进行独立的决策并产生行为。
易感人群的流动性及其与感染者的互动是传染病传播至关重要的条件,然而由于人群在空间上的分布具有异质性[14],不符合传统仓室模型中的同质化假设,因此将空间信息纳入模型可以一方面提高传染病传播的精确度,同时可以模拟传染病传播的精细尺度的细节。根据模型中是否考虑到人群和病例的空间位置信息,可以将传染病传播模型分为空间隐式和空间显式2种类型。目前的空间显式传染病传播模型的研究范围大多集中在国家乃至洲级尺度,将城市作为研究中的最小基本单位,相关研究在甲型H1N1、新型冠状病毒感染COVID-19的大流行的传播模拟中取得较好的拟合效果[14-16]。但这类研究较少深入到城市内部精细尺度,在精细防控与精细化解析传播过程方面具有一定的局限性[17]
而近年来,真实人群出行数据、高精度的人口密度分布数据的应用以及传染病空间传播模型的发展,为精细化地刻画城市内部传染病时空传播过程提供了可能[18]。其中部分研究耦合了真实人群轨迹、出行与活动模式数据,建立城市内部百万甚至千万级别个体的智能体模型,并对不同的防控场景、防控措施下的效果进行模拟和评估,从而为城市防控措施的制定提供参考[19-20]。这类研究的重点在于使用智能体模型对防控场景、措施的模拟,而不涉及对传染病空间传播过程的模拟。另一类研究则在集合种群模型的基础上对城市内部空间结构进行细分,例如结合了人口密度格网,将每个格网内人群视为一个子群落,结合格网之间人口流动对城市内传染病时空传播过程进行 模拟[21-22]。但这些研究中主要采用随机流动的人口流动模式,并不符合城市中以通勤为主的人口流动模式[23-24]。基于手机信令大数据的研究发现,通勤人口与常住人口表现出良好的线性关系,基于常住人口数建立的重力模型和辐射模型已经在城市内部高分辨率栅格之间的交通出行量模拟中得到了较好的精度[25],从而可以在不依赖手机信令大数据的前提下,对大规模的人口流动行为进行建模和估计,为城市内部精细化的传染病传播过程建模奠定基础,但目前其在城市内传染病空间传播领域的应用还亟待研究。
手足口病(Hand Foot and Mouth Disease, HFMD)是我国最常见的传染病之一,在我国每年发病人数约为50~100万[26],其发病人群多为5岁以下儿童,但是成人也会患病。本文以长沙市2014年第1~49周HFMD传播过程为案例,将多种人口流动模型与传染病传播模型相结合,探索和比较不同的人口流动模型在城市内部传染病时空间传播的精细化模拟过程中的精确度和适用性,从而为城市高效制定和实施传染病精准防控措施提供科学依据。

2 研究区概况与数据来源

2.1 研究区概况

作为湖南省省会以及我国南方重要的特大型城市,截至2020年,长沙市总面积为11 819 km2,常住人口1004.79万人,其中城镇人口830万人,常住人口密度约为830人/km2
根据《长沙市城市总体规划(2003—2020)》[27]中对长沙市各区域的规划,本研究选择了城市人口高度集中的长沙市都市区中32 km×32 km的方形区域作为研究区域,该区域覆盖了长沙市的芙蓉区、开福区、雨花区、天心区全部,以及岳麓区和长沙县部分区域(图1)。
图1 长沙市研究区行政区划、人口分布概况

Fig. 1 Administrative division and population distribution of research area in Changsha

2.2 数据来源

本文以2014年第1~49周长沙市HFMD传播过程为研究对象,涉及的HFMD病例数共计57 838例,病例数据由湖南省疾病预防控制中心提供。在城市内传染病时空传播建模中,我们分别按照周和1 km×1 km公里格网来汇总每周各格网的发病病例数,共获得49周1024个格网的病例数数据。另外,计算所用的公里格网总人口数据则来自中国2014年公里网格人口分布数据集[28]

3 传染病时空传播模型构建

3.1 技术路线

本文基于2014年长沙市HFMD病例数据和人口密度栅格进行城市内传染病时空传播模型的构建和验证,并比较不同的人口流动模型下城市内部传染病空间传播模型的精确度和适用性。技术路线如图2所示。本文使用的传染病时空传播模型是基于集合种群模型构建,其基本思想是将研究区每一个1 km×1 km栅格中的人群视为一个子群落。城市内部HFMD的时空传播过程由2个部分组成:格网中子群落内部HFMD传播和子群落间因人口流动造成的HFMD传播。每个子群落内部具有独立的传播动力学过程,周期SEIR动力学模型被用于模拟子群落内部的传播过程,子群落间的人口流动则分别使用邻域扩散、重力以及辐射模型来模拟。研究过程分为以下2个部分:① 基于不同的人口流动模型,对长沙市都市区传染病空间传播模型进行构建,估计模型参数;② 基于构建的传染病传播模型模拟长沙市HFMD时空传播过程,验证不同人口流动模型下模型模拟结果的时间、空间精度,并比较了模型在不同常住人口数的格网中的精度差异,以及不同模型基于早期HFMD数据对其未来传播过程的预测能力。
图2 技术路线

Fig. 2 Methodological workflow plot

3.2 周期SEIR动力学模型

本文使用周期SEIR动力学模型来描述每个格网中HFMD随时间传播的过程,该模型常被用于对具有周期性高峰的传染病传播进行建模。
SEIR传播动力学模型将研究区域人口划分为四类人群:易感人群(S),潜伏期人群(E),感染人群(I)和恢复期人群(R)。周期SEIR动力学模型中不同人群之间转化的微分方程如下[29]:
d S d t = u m - β S I m - d S
d E d t = β S I m - ε E - d E
d I d t = ε E - γ I - d I
d R d t = γ I - d R
由于HFMD在我国每年存在4—6月的夏季高峰和每年10—12月的秋季小高峰[30],其传播率在一年之中存在差异,在流行高峰中传播率会大幅增加,因此本文将传播率 β ( t )定义为随时间变化的函数,而手足口病的流行具有半年周期且在一年中两次流行的流行强度不同,因此本文选择半年(26周)和一年(52周)周期的正弦波对 β ( t )进行拟合,26周周期的正弦波表示半年内的变化,52周周期的正弦波表示上半年和下半年的差别,其计算公式为:
β t = a + b · c o s 2 π t - φ 26 26 + c · c o s 2 π t - φ 52 52
由于手足口病主要发生于5岁以下的儿童,因此本研究针对该年龄人群建立传播动力学模型。本研究获取的第六次人口普查数据中只包含了各分区的年龄组成结构,因此我们将每个格网中0~5岁人口比例设置为所在分区的0~5岁人口比例,结合人口密度网格,得到各格网的0~5岁常住人口数。
周期性SEIR动力学模型需要设置初始时刻4种人群( S 0 ,   E 0 ,   I 0 ,   R 0)的人口数量,其中 S 0设置为长沙市0~5岁人口数, E 0 R 0设置为0, I 0为长沙市2014年第1周HFMD发病人数(表1)。其余参数中出生率 u,死亡率 d均来自于2014年《长沙市国民经济和社会发展统计公报》[31]。前人研究结果表明,手足口病的潜伏期为3~5 天,平均恢复期为7 天,因此本文将 1 / σ 1 / γ分别设置4.5和7 天[32-33],剩余参数则通过参数估计获得,方法见3.4。
表1 周期SEIR动力学模型参数

Tab. 1 Parameters of periodic SEIR model

参数名称 参数定义
m 0—5岁常住人口数/人
t 日历周数/周
S , E , I , R 易感人群, 潜伏期人群, 感染人群, 恢复期人群数量/人
u , d 长沙市2014年出生率,死亡率/%
1 / ε 潜伏期人群中每个个体在潜伏期状态到感染状态的平均时间/周
1 / γ 感染人群中每个个体在感染状态到获得免疫的平均时间(恢复期)/周
β HFMD传播率
a 周期函数截距项
b, c 周期函数振幅
φ 26, φ 52 周期函数半年、一年周期相位值

3.3 人口流动和时空扩散模型

人口流动模式限定了哪些格网之间存在人口流动,同时代表了HFMD随着人口流动在空间上扩散的模式。由于城市内居民短时间内居住地、就业地不会发生改变,而上学、日常购物等行为的目的地选择发生改变的可能性同样较小,因而城市居民通勤、通学、日常购物等生活必须出行的出发地和目的地的选择上具有一定的稳定性,这导致城市内部的人口流动具有一段时期内的稳定性和区位依赖性。因此本文选择邻域扩散模型、重力模型以及辐射模型对城市内的这些生活必须出行行为进行模拟。
重力模型[34]源于引力公式,假定两地间的人口流动强度与“质量”(本文中为常住人口数)成正比,与其间距成反比,其计算公式如下:
T i j = C m i μ m j ρ d i j τ
辐射模型起源于粒子扩散现象,它将人口流动看作一个受联合概率支配的随机过程,两地之间的人口流动强度取决于出发地、目的地、影响范围(以出发地为圆心,两地距离为半径的圆形区域)的人口分布[35],计算公式为:
T i j = T i m i × m j m i + s i j × m i + m j + s i j
表2所示,除了2种人口流动模型外,本文选择了集合种群模型中常用的邻域扩散模型与2种人口流动模型进行对比。在邻域模式上,本文使用了4邻域、8邻域和24邻域共3种邻域空间扩散模式。考虑到如果邻域扩散模型中对各个格网设置特异性的人口流动权重会使模型中存在大量参数,这会提高模型的不确定性并给参数估计带来困难。因此本文对邻域扩散模式做出假设,格网之间人口流动规律是相似的,每个格网在各方向以相同比例均匀扩散,但对于S、E、I、R 4种不同人群具有不同比例,且该比例在不同格网间一致。
表2 人口流动模式参数

Tab. 2 Parameters of population movement patterns

参数名称 参数定义
T i j i , j格网之间的人口流动数/人
C 重力模型归一化系数
m i, m j i , j格网中的0—5岁常住人口数/人
d i j i , j格网中心之间的欧式距离/千米
μ , ρ , τ 重力模型矫正因子,反映居住地、目的地格网的常住人口数以及格网距离对人口流动的影响
T i i格网的出行人口总数/人
s i j i格网的中心点为圆心, d i j为半径的圆形区域内所有格网的常住人口总和/人
v S , 4 , v E , 4 , v I , 4 , v R , 4 , 4邻域扩散中S、E、I、R四种人群流出比例/%
v S , 8 , v E , 8 , v I , 8 , v R , 8 , 8邻域扩散中S、E、I、R四种人群流出比例/%
v S , 24 , v E , 24 , v I , 24 , v R , 24 , 24邻域扩散中S、E、I、R四种人群流出比例/%
考虑到手足口病的感染者以儿童为主,因此本文将每个格网的出行人口总数 T i定义为其中0~5岁的常住人口人群数量。
将周期SEIR动力学模型与4、8、24邻域扩散,重力模型以及辐射模型共5种人口流动模式分别进行组合后,本文得到了不同人口流动模式下的5种城市内传染病时空传播模型,分别为周期SEIR-4邻域扩散传染病传播模型(M1模型)、周期SEIR-8邻域扩散传染病传播模型(M2模型)、周期SEIR-24邻域扩散传染病传播模型(M3模型)、周期SEIR-重力模型传染病传播模型(G1模型)和周期SEIR-辐射模型传染病传播模型(R1模型)。各模型在每次单位时间(周)中包含“人口流出-格网内传播-人口回流”3个步骤,具体如下:
(1)人口从居住地格网移动到目的地格网中,在基于重力和辐射模型的传播模型中,该过程的流动人口的S、E、I、R比例按照各仓室人群占常住人口数的比例进行流动。
(2)在完成人口流动后,每个格网上基于周期SEIR动力学模型发生独立的HFMD传播过程。
结合式(1)、(2)过程,本文中传染病时空传播模型数学结构如式(8)—式(11)所示。
d S i d t = μ m i - β S i I i m i - d S i - v S i S p + j J v S j i S j
d E i d t = β S i I i m i - ε E i - d E i - v E i E i + j J v E j i E j
d I i d t = ε E i - γ I i - d I i - v I i I i + j J v I j i I j
d R i d t = γ I i - d R i - v R i R i + j J v R j i R j
式中: i为格网编号;j为除 i以外所有格网的集合(在邻域扩散中为 i的邻近格网的集合), S i表示格网 i中的易感人群数量; v S i表示从 i格网流出易感人群的百分比; v S j i表示从 j格网流向 i格网的易感人群数,在基于重力、辐射模型的扩散模型中 v S i= T i S i/ m i v S j i= v S j T j i / T j;在邻域扩散模型中 v S i为估计参数, v S i = v S , n v S j i= v S j / n,其中 n为邻域的个数。其余各仓室人群参数命名方式,以及人群的流入、流出人口占比的计算方式与易感人群相同。
(3)最终相同的人口数会从目的地格网流回至原格网,在基于重力和辐射模型的传播模型中流动人口S、E、I、R比例的计算方式与步骤(1)中相同,各格网的常住人口数保持稳定。

3.4 模型拟合

参数估计是寻找最适合真实数据的模型参数组合,上述的时空扩散模型中包含了周期SEIR动力学模型中的众多流行病学参数、邻域扩散、重力以及辐射模型中大量人口流动模式的相关参数。除了部分参数通过查阅相关资料与前人研究获得外,其余参数则采用蒙特卡罗方法(Monte Carlo method, MC)进行参数估计,该方法需要设置初始的范围及分布,这里将各参数先验分布假设为随机分布,对参数集进行抽样后,计算当前参数下模型精度,多次抽样后选择精度最优的参数组合。
考虑到同时估计大量参数会导致模型的不确定性,本文对周期SEIR动力学模型以及人口流动模式中的参数分别进行MC估计,首先基于2014年第1~49周的长沙市HFMD发病人数,以各周模拟和真实发病人数之间的均方根误差(Root Mean Square Error,RMSE)为精度评价指标,进行 1000 000次抽样后得到最优的周期SEIR动力学模型参数。而人口流动模式中的参数,则基于周期性SEIR动力学模型得到的最优参数,构建起城市内传染病传播模型,以空间维度精度评价指标 r s p a i t a l _ s t(见3.5节),进行10 000次抽样后得到最优参数。各参数估计的初始范围和最优值见表3
表3 参数估计结果

Tab. 3 Parameters estimation results

所属模型 参数 初始范围 最优参数值
周期性SEIR动力学模型 a (0.5, 1.5) 1.08
b (0, 0.5) 0.13
c (0, 0.5) 0.13
φ 26 (0, 26.0) 13.02
φ 52 (0, 52.0) 18.95
4邻域扩散模型 v s , 4 (0, 1.0) 0.39
v E , 4 (0, 1.0) 0.53
v I , 4 (0, 1.0) 0.22
v R , 4 (0, 1.0) 0.48
8邻域扩散模型 v s , 8 (0, 1.0) 0.42
v E , 8 (0, 1.0) 0.45
v I , 8 (0, 1.0) 0.20
v R , 8 (0, 1.0) 0.46
24邻域扩散模型 v s , 24 (0, 1.0) 0.36
v E , 24 (0, 1.0) 0.49
v I , 24 (0, 1.0) 0.24
v R , 24 (0, 1.0) 0.51
重力模型 C (0,0.01) 6.82e-4
μ (1.0, 2.0) 1.03
ρ (1.0, 2.0) 1.05
τ (1.0, 3.0) 1.48

3.5 精度评价指标与方法

本研究用基于模型估计值与HFMD病例数真值之间的皮尔逊相关系数(Pearson's r, r)和RMSE作为指标来对模型精确度进行评价,两者可以分别度量模型对于传染病传播的趋势,以及传染病发病病例数的模拟精确程度。由于本文构建的传染病时空传播模型包含了时间和空间2个维度,因此在精度评价时选择从这两个维度计算模型的精度,分别为时间维度和空间维度的相关系数 r t i m e r s p a t i a l以及均方根误差 R M S E t i m e R M S E s p a i t a l r t i m e R M S E t i m e2个时间维度评价指标的计算方法为:将同一周中所有格网中总的病例数和模型估计病例数进行汇总,得到二者的时间序列后计算rRMSE
在空间维度检验指标上,本文分别采用了“先时间后空间”和“先空间后时间”的思想,第一种空间维度指标 r s p a i t a l _ s t R M S E s p a i t a l _ s t是将各格网视为一个独立单位,计算每个格网上在整个研究时间范围内模型估计值和真实病例数的r和RMSE后,计算所有格网的rRMSE的均值作为空间维度精度指标,并计算其标准差。第2种 r s p a i t a l _ t s R M S E s p a i t a l _ t s则对每周所有的格网的模型估计值和HFMD病例数真值之间计算rRMSE,并同样对各周rRMSE求平均值和标准差。2种不同空间维度评价指标,分别反映了不同格网之间以及整个时间范围内的精度的平均和变化状况。
除了使用多种时空维度评价指标来对模型经确定评价外,考虑到本文中重力模型和辐射模型都是基于格网内常住人口数来对格网间人口流动进行估计,因此可能导致建立的城市内传染病传播模型的精度对格网的常住人口数较为敏感。因此本文将整个研究范围内按照格网的常住人口数的四分位数进行划分,分别计算了每个四分位数区间中格网的 r s p a i t a l _ t s R M S E s p a i t a l _ t s及其标准差的结果。
为了探索各模型在疫情爆发早期对城市内HFMD传播的预测能力,本文使用了整个研究时间范围中的前 N周数据进行模型最优参数的估计,其中 N =5,6,7,…,47,48,49,并基于得到的参数预测后续的HFMD时空传播过程,使用上述的指标对模型在HFMD传播全过程中的精度进行评价。

4 模型拟合与验证

4.1 时空传播过程拟合

图3展示了各传播模型对长沙市HFMD病例数在时序上的拟合结果,由于均采用周期SEIR作为格网内的传播动力学模型,各传播模型的拟合曲线均表现为间隔半年的2次高峰,并且在高峰的出现时间上保持一致,但2个高峰的峰值上存在一定的差异。各模型存在对4—7月的高峰高估和对9—11月的高峰低估的现象,但在HFMD病例迅速增加的4—5月的拟合效果较好。而在不同模型中,其中基于重力模型的传播模型对4—7月的高峰拟合接近真实HFMD病例数,而对9—11月的拟合出现病例数较低;基于辐射模型的传播模型与之相反,在4—7月的高峰拟合病例数高于真实病例数,而对9—11月拟合效果较好,而3种基于邻域扩散的传播模型的拟合病例数则介于两者之间。
图3 各传播模型长沙市2014年HFMD病例数拟合曲线

Fig. 3 Fitting curve of the number of HFMD cases in Changsha in 2014 by transmission models

图4图9分别展示了2014年第11~31周长沙市HFMD病例真实时空分布情况,以及5种模型的模拟病例的时空分布。在11~13周中HFMD病例在研究区域中呈现为零星分布,随着时间发展在城市中心发病人数增多,然后向城市周边扩散,25周后城市周边发病人数减少至消亡,中心区域病例仍然持续存在并在28周后快速消亡。
图4 长沙市2014年手足口病病例时空分布

Fig. 4 Spatial and temporal distribution of HFMD cases in Changsha in 2014

图5 模拟长沙市2014年HFMD病例时空分布图(M1模型)

Fig. 5 Simulation of spatial and temporal distribution of HFMD cases in Changsha in 2014 by M1 model

图6 模拟长沙市2014年HFMD病例时空分布图(M2模型)

Fig. 6 Simulation of spatial and temporal distribution of HFMD cases in Changsha in 2014 by M2 model

图7 模拟长沙市2014年HFMD病例时空分布图(M3模型)

Fig. 7 Simulation of spatial and temporal distribution of HFMD cases in Changsha in 2014 by M3 model

图8 模拟长沙市2014年HFMD病例时空分布图(G1模型)

Fig. 8 Simulation of spatial and temporal distribution of HFMD cases in Changsha in 2014 by G1 model

图9 模拟长沙市2014年HFMD病例时空分布图(R1模型)

Fig. 9 Simulation of spatial and temporal distribution of HFMD cases in Changsha in 2014 by R1 model

从模拟病例的时空分布来看,5种模型均能够一定程度上拟合真实的手足口病传播过程,但对格网内HFMD发病人数存在低估的现象,M1—M3共3种基于邻域扩散的时空传播模型的模拟结果中HFMD表现出相似的传播的方向和趋势,8邻域和24邻域在4邻域的基础上,进一步扩大了HFMD传播范围,但同时也带来了模拟的HFMD病例分布图更为平滑,高值区域不突出的问题。相较于真实的HFMD病例分布情况,邻域扩散模型对中部以及西南部区域的HFMD病例集中格网具有较好的拟合效果,并且中部和西南区域中其模拟的病例分布范围过于集中,对于高值区域的分布存在差异,并存在对东北部和北部区域的HFMD高值区域拟合效果较差的问题。
基于重力和辐射模型的传染病传播扩散模型G1和R1,在HFMD病例分布的模拟结果上表现出一定的相似性,HFMD模拟病例的高发区域均集中集中于中部、南部和西北区域。相较于基于邻域扩散的M1-M3模型,G1和R1模型可以更好地覆盖HFMD真实病例的中部分布区域,但同时在该区域中,2种模型均表现出了与M2和M3 2种模型类似的病例分布较为平滑的特征。除了中部区域的病例分布较为相似外,G1和R1 2种模型之间也存在一定差异,G1模型所拟合的西北部HFMD病例分布区域范围相较于真实分布较小,此外G1模型模拟的HFMD病例分布在整个研究区域内存在大量离散的点状分布,而R1模型的HFMD病例模拟分布则主要呈现出斑块状。

4.2 模型精度比较

表4表5为5种模型的时间和空间维度精度进行对比,表6为不同常住人口水平下模拟精度比较结果。结果表明:在时间维度上,5种模型 r t i m e均大于0.85,但M1—M3 3种基于邻域模型的传播模型表现出具有相对更低的 R M S E t i m e值。表明5种人口扩散模型均能较好地拟合HFMD传播的整体时间趋势,但M1—M3模型在在对长沙市整体HFMD病例数量的估计上具有优势。
表4 基于相关系数r的时空间维度精度评价

Tab. 4 Evaluation of temporal and spatial accuracy based on correlation coefficient r

模型名称 r t i m e r s p a t i a l _ t s r s p a t i a l _ t s标准差 r s p a t i a l _ s t r s p a t i a l _ s t标准差
N1 0.87 0.41 0.11 0.30 0.21
N2 0.88 0.40 0.12 0.30 0.20
N3 0.89 0.41 0.11 0.33 0.22
G1 0.91 0.46 0.11 0.39 0.20
R1 0.88 0.37 0.09 0.34 0.19
表5 基于RMSE的时空间维度精度评价

Tab. 5 Evaluation of temporal and spatial accuracy based on RMSE

模型名称 R M S E t i m e R M S E s p a t i a l _ t s R M S E s p a t i a l _ t s标准差 R M S E s p a t i a l _ s t R M S E s p a t i a l _ s t标准差
N1 113.67 0.96 0.65 0.59 1.02
N2 118.22 0.97 0.64 0.61 1.00
N3 120.19 0.95 0.63 0.58 0.96
G1 122.58 1.00 0.65 0.57 1.02
R1 130.14 1.08 0.75 0.69 1.07
表6 不同常住人口水平下模拟精度比较

Tab. 6 Simulaiton accuracy under different levels of resident populations

格网人口数 模型名称 r s p a t i a l _ t s r s p a t i a l _ t s标准差 R M S E s p a t i a l _ s t R M S E s p a t i a l _ s t标准差
最小值-Q1 M1 0.30 0.21 0.38 0.69
M2 0.28 0.22 0.38 0.69
M3 0.31 0.22 0.41 0.65
G1 0.27 0.17 0.43 0.83
R1 0.21 0.22 0.42 0.75
Q1-Q2 M1 0.22 0.23 0.40 1.29
M2 0.21 0.24 0.41 1.24
M3 0.24 0.24 0.42 1.26
G1 0.27 0.25 0.47 0.93
R1 0.22 0.17 0.47 1.52
Q2-Q3 M1 0.24 0.22 0.44 0.64
M2 0.24 0.23 0.42 0.59
M3 0.25 0.22 0.45 0.59
G1 0.29 0.20 0.41 0.66
R1 0.25 0.22 0.50 0.56
Q3-最大值 M1 0.44 0.21 1.19 1.01
M2 0.44 0.21 1.18 0.99
M3 0.42 0.23 1.12 0.91
G1 0.55 0.22 0.92 0.83
R1 0.50 0.22 1.00 0.85
在空间维度的评价指标中,基于重力模型的G1模型在 r s p a t i a l _ t s r s p a t i a l _ s t2种空间维度的r显著高于其余4种模型,并保持了与其余4种模型一致的标准差;2种空间维度的RMSE指标中,其 R M S E s p a t i a l _ s t低于其余4种模型,仅有 R M S E s p a t i a l _ t s略高于邻域扩散的M1—M3模型。而基于辐射模型R1模型在4种空间维度指标中,除了 r s p a t i a l _ s t外的其余3种指标均相比其余4种模型表现较差。这反映了基于重力模型的G1模型在空间维度上具有较好的拟合效果,其中在对疾病传播的时空间趋势的模拟上相较于基于邻域扩散的M1—M3和辐射模型的R1模型均具有明显的优势,而在对各格网病例数的模拟上,G1模型的表现则与基于邻域扩散的M1—M3模型较为接近。而R1模型在对整个长沙市的HFMD时空传播过程模拟上,综合表现较差。
基于格网的常住人口数的4分位数将所有格网分为4个常住人口等级的区域后,其中Q1、Q2、Q3分别表示第一、二、三四分位数,不同区域内部的 r s p a t i a l _ s t R M S E s p a t i a l _ s t及其标准差如表6所示。5种模型均在常住人口数大于Q3的人口相对稠密区域中表现出更好的拟合精度,而在其余3个区域中的拟合精度较为接近。在不同模型的比较上,基于邻域扩散的M1—M3 3种模型,在常住人口小于Q2的区域中在 r s p a t i a l _ s t R M S E s p a t i a l _ s t2个评价指标上均优于基于重力和辐射模型的G1和R1 2种模型;在常住人口大于Q2的2个区域中,G1和R1模型则在2个指标上均表现出明显的优势,说明G1和R1 2个模型在人口密集区域对HFMD空间传播趋势和病例数的分布均具有更好的拟合效果,而在二者之间,G1模型具有更高的精度。
基于前 N周数据参数估计的模型的精度验证结果如图10所示,基于重力模型的M1模型验证精度的收敛速度最慢,在20周以下数据用于训练时,在各精度指标上均相比其余4种模型表现较差,而在25周及以上的数据用于训练时,其空间维度指标 r s p a t i a l _ t s r s p a t i a l _ t s则大于其余4种模型。而基于辐射模型的R1模型验证精度收敛速度最快,在使用25周及以下的数据用于测试时,在4种空间维度指标上优于其余4种模型,但在使用全部数据用于训练后,在除 r s p a t i a l _ s t以外指标上其表现差于其余4种模型。而基于邻域扩散模型的M1-M3模型验证精度的收敛速度则介于二者之间。
图10 前 N周数据参数估计模型的HFMD传播预测精度验证

分析可得:①在整体上,基于重力模型的G1模型在对HFMD空间传播趋势的拟合效果上优于其余4种模型,而基于邻域扩散3种模型则对HFMD格网病例数具有较好的拟合效果,其中24邻域扩散的M3模型拟合效果最优。②在根据常住人口数对格网进行划分后,G1和R1两种模型的拟合效果对格网的常住人口数较为敏感,在常住人口数较高水平的格网的拟合效果显著优于基于邻域扩散的3种模型。③基于重力模型的G1模型的拟合效果依赖于训练数据的时间长度,而基于辐射模型的R1模型则在早期数据训练下即可得到较高的拟合精度,在4种模型具有最好的早期HFMD传播预测能力。

Fig. 10 HFMD transmission simulation verification based on parameter estimation model by first N weeks' data

5 结论

5.1 结论

城市具有复杂的空间结构和人口分布特征,因此城市内部传染病空间传播的精细化模拟是制定精确的隔离等预防政策措施,实现城市层次的精准防疫的基础。本文以长沙市2014年HFMD疫情为案例,将经典的人口流动模型与传染病时空传播模型相结合,探索在不同的人口流动模型下,传染病时空传播模型在城市内部的精确度和适用性比较。
模型的拟合效果表明:①在整体模拟效果上,基于重力模型构建的传播模型在HFMD空间传播趋势拟合上最优(rspatial_ts=0.46,rspatial_st=0.39),在格网病例数模拟上基于24邻域扩散的传播模型具有最好的拟合效果(RMSEspatial_ts=0.58,RMSEspatial_ts=0.95)。②基于重力、辐射模型构建的传播模型的精度对格网的常住人口数更为敏感,其在常住人口数较高水平的格网中模拟精度的提升显著,在人口稠密区域具有显著优势,其中前者在格网常住人口数大于第三四分位数区域中rspatial_ts=0.55,RMSEspatial_ts=0.92,后者在该区域中同样具有显著的精度提升,其rspatial_tsRMSEspatial_ts分别达到0.50和1.0。③基于重力模型的传播模型在HFMD疫情早期预测中对后续HFMD传播预测精度较差,不适用于传染病疫情早期的传播预测。而辐射模型作为几种人口流动模式中唯一的无参数模型,尽管在整体精度上表现其欠佳,但在HFMD疫情早期的预测中具有最高的精度,在传染病早期对后续传播过程的预测上具有显著优势。

5.2 讨论与展望

在进行城市内部HFMD传播模拟过程中,本研究具有一定的局限性:
(1)HFMD作为流行病学年龄特征十分明显的传染病,发病人数以0~5岁儿童为主,由于缺乏病例的年龄信息,因此本研究建模时认为所有病例均属于0~5岁儿童,且由于数据的限制,各格网中0~5岁人口数量是基于各分区的年龄组成结构计算得到,无法更细致地反映出0~5岁儿童空间分布特征。
(2)本文选用的周期性SEIR模型只考虑了HFMD的季节性规律,在时间维度精度欠佳,在后续研究中可以进行改进;
(3)重力模型和辐射模型主要是构建格网之间较为稳定的人口流动关系,包括城市内的通勤、上学以及外出购物等生活必须出行行为,而无法表示随机的人口流动行为,后续研究中可以加入人随机性的人口流动行为,考虑疾病所涉及到的风险人群出行模式对疾病传播的影响,也可以通过获取实际人口移动数据来验证人口扩散模式模拟的精度;
(4)在重力和辐射模型中格网间人口流动关系主要考虑了格网的常住人口和格网间的距离两方面因素,后续研究中可以考虑到格网的中学校、医院等兴趣点的分布,以及格网的功能区属性,将其纳入模型中。
[1]
World Health Organization. The world health report 2000: health systems: Improving performance[M]. Geneva: World Health Organization, 2000.

[2]
Anderson R M, May R M. Infectious diseases of humans: dynamics and control[M]. Oxford University Press, 1991.

[3]
Mei S, Chen B, Zhu Y F, et al. Simulating City-level airborne infectious diseases[J]. Computers, Environment and Urban Systems, 2015, 51:97-105. DOI:10.1016/j.compenvurbsys.2014.12.002

DOI

[4]
De Ver Dye T, Muir E, Farovitch L, et al. Critical medical ecology and SARS-COV-2 in the urban environment: A pragmatic, dynamic approach to explaining and planning for research and practice[J]. Infectious Diseases of Poverty, 2020, 9(1):71. DOI:10.1186/s40249-020-00694-3

DOI PMID

[5]
Alirol E, Getaz L, Stoll B, et al. Urbanisation and infectious diseases in a globalised world[J]. The Lancet Infectious Diseases, 2011, 11(2):131-141. DOI:10.1016/S1473-3099(10)70223-1

DOI

[6]
Kermack W O, McKendrick A G. Contributions to the mathematical theory of epidemics—II. the problem of endemicity[J]. Bulletin of Mathematical Biology, 1991, 53(1/2):57-87. DOI:10.1016/S0092-8240(05)80041-2

DOI

[7]
徐致靖, 祖正虎, 许晴, 等. 传染病动力学建模研究进展[J]. 军事医学, 2011, 35(11):828-833.

[Xu Z J, Zu Z H, Xu Q, et al. Research advances in modeling infectious disease[J]. Military Medical Sciences, 2011, 35(11):828-833. ] DOI:10.3969/j.issn.1674-9960.2011.11.007

DOI

[8]
张发, 李璐, 宣慧玉. 传染病传播模型综述[J]. 系统工程理论与实践, 2011, 31(9):1736-1744.

[Zhang F, Li L, Xuan H Y. Survey of transmission models of infectious diseases[J]. Systems Engineering-Theory & Practice, 2011, 31(9):1736-1744. ] DOI:10.12011/1000-6788(2011)9-1736

DOI

[9]
Hanski I, Gaggiotti O E. Ecology, genetics, and evolution of metapopulations[M]. Burlington, MA: Elsevier,© 2004

[10]
Ganesan S, Subramani D. Spatio-temporal predictive modeling framework for infectious disease spread[J]. Scientific Reports, 2021, 11:6741. DOI:10.1038/s41598-021-86084-7

DOI PMID

[11]
White S H, del Rey A M, Sánchez G R. Modeling epidemics using cellular automata[J]. Applied Mathematics and Computation, 2007, 186(1):193-202. DOI:10.1016/j.amc.2006.06.126

DOI PMID

[12]
毕雪, 苏弘博, 郭佳慧, 等. 元胞自动机及其在传染病防控领域中的应用[J]. 实用预防医学, 2015, 22(6):766-769.

[Bi X, Su H B, Guojia H, et al. Cellular automata and its application in the field of infectious disease prevention and control[J]. Practical Preventive Medicine, 2015, 22(6):766-769. ] DOI:10.3969/j.issn.1006-3110.2015.06.044

DOI

[13]
Cuevas E. An agent-based model to evaluate the COVID-19 transmission risks in facilities[J]. Computers in Biology and Medicine, 2020, 121:103827. DOI:10.1016/j.compbiomed.2020.103827

DOI

[14]
O'Sullivan D, Gahegan M, Exeter D J, et al. Spatially explicit models for exploring COVID-19 lockdown strategies[J]. Transactions in GIS: TG, 2020, 24(4):967-1000. DOI:10.1111/tgis.12660

DOI

[15]
Balcan D, Gonçalves B, Hu H, et al. Modeling the spatial spread of infectious diseases: The GLobal Epidemic and Mobility computational model[J]. Journal of Computational Science, 2010, 1(3):132-145. DOI:10.1016/j.jocs.2010.07.002

DOI PMID

[16]
Gatto M, Bertuzzo E, Mari L, et al. Spread and dynamics of the COVID-19 epidemic in Italy: Effects of emergency containment measures[J]. Proceedings of the National Academy of Sciences of the United States of America, 2020, 117(19):10484-10491. DOI:10.1073/pnas.2004978117

DOI PMID

[17]
尹凌, 刘康, 张浩, 等. 耦合人群移动的COVID-19传染病模型研究进展[J]. 地球信息科学学报, 2021, 23(11):1894-1909.

DOI

[Yin L, Liu K, Zhang H, et al. Integrating human mobility into the epidemiological models of COVID-19: Progress and challenges[J]. Journal of Geo-Information Science, 2021, 23(11):1894-1909. ] DOI:10.12082/dqxx kx.2021.210091

DOI

[18]
裴韬, 王席, 宋辞, 等. COVID-19疫情时空分析与建模研究进展[J]. 地球信息科学学报, 2021, 23(2):188-210.

DOI

[Pei T, Wang X, Song C, et al. Review on spatiotemporal analysis and modeling of COVID-19 pandemic[J]. Journal of Geo-Information Science, 2021, 23(2):188-210. ]

[19]
张浩, 尹凌, 刘康, 等. 深圳市快速抑制COVID-19疫情的非药物干预措施效果评估:基于智能体的建模研究[J]. 地球信息科学学报, 2021, 23(11):1936-1945.

DOI

[Zhang H, Yin L, Liu K, et al. Effectiveness of non-pharmaceutical interventions on suppressing the 1st wave of COVID-19 epidemic in Shenzhen: An agent-based modelling study[J]. Journal of Geo-Information Science, 2021, 23(11):1936-1945. ]

[20]
Aleta A, Martín-Corral D, Pastore y Piontti A, et al. Modelling the impact of testing, contact tracing and household quarantine on second waves of COVID-19[J]. Nature Human Behaviour, 2020, 4(9):964-971. DOI:10.1038/s41562-020-0931-9

DOI PMID

[21]
Holko A, Mȩdrek M, Pastuszak Z, et al. Epidemiological modeling with a population density map-based cellular automata simulation system[J]. Expert Systems With Applications, 2016, 48:1-8. DOI:10.1016/j.eswa.2015.08.018

DOI

[22]
Munshi J, Roy I, Balasubramanian G. Spatiotemporal dynamics in demography-sensitive disease transmission: COVID-19 spread in NY as a case study[EB/OL]. 2020: arXiv: 2005.01001. https://arxiv.org/abs/2005.01001

[23]
周素红, 杨利军. 广州城市居民通勤空间特征研究[J]. 城市交通, 2005, 3(1):62-67.

[Zhou S H, Yang L J. Study on the spatial characteristic of commuting in Guangzhou[J]. Urban Transport of China, 2005, 3(1):62-67. ] DOI:10.3969/j.issn.1672-5328.2005.01.015

DOI

[24]
刘耀林, 方飞国, 王一恒. 基于手机数据的城市内部就业人口流动特征及形成机制分析——以武汉市为例[J]. 武汉大学学报·信息科学版, 2018, 43(12):2212-2224.

[Liu Y L, Fang F G, Wang Y H. Characteristics and formation mechanism of intra-urban employment flows based on mobile phone data: Taking Wuhan City as an example[J]. Geomatics and Information Science of Wuhan University, 2018, 43(12):2212-2224. ] DOI:10.13203/j.whugis20180140

DOI

[25]
刘云舒, 赵鹏军, 吕迪. 大数据城市通勤交通模型的构建与模拟应用[J]. 地球信息科学学报, 2021, 23(7):1185-1195.

DOI

[Liu Y S, Zhao P J, Lv D. Big-data oriented commuting distribution model and application in large cities[J]. Journal of Geo-information Science, 2021, 23(7):1185-1195. ] DOI:10.12082/dqxxkx.2021.200334

DOI

[26]
Wang J F, Guo Y S, Christakos G, et al. Hand, Foot and Mouth Disease: Spatiotemporal transmission and climate[J]. International Journal of Health Geographics, 2011, 10:25. DOI:10.1186/1476-072X-10-25

DOI

[27]
长沙市城乡规划局. 《长沙市城市总体规划(2003-2020)(2014年修订)》公布[J]. 城市规划通讯, 2014,(16):11-2.

[Urban and Rural Planning Bureau of Changsha City. "Master Plan of Changsha City (2003-2020) (Revised in 2014)" announced[J]. Urban Planning Newsreport, 2014,(16):11-2. ]

[28]
徐新良. 中国人口空间分布公里网格数据集[DS]. 中国科学院资源环境科学数据中心数据注册与出版系统 (http://www.resdc.cn/DOI), 2017.

[Xu X L. Kilometer Grid Dataset of Population Spatial Distribution in China[DS]. Data Registration and Publishing System of Resource and Environmental Science Data Center, Chinese Academy of Sciences(http://www.resdc.cn/DOI), 2017. ] DOI:10.12078/2017121101

DOI

[29]
Keeling M J, Rohani P. Modeling infectious diseases in humans and animals[M]. Princeton: Princeton University Press, 2008.

[30]
胡跃华, 肖革新, 郭莹, 等. 2008—2011年中国大陆手足口病流行特征分析[J]. 中华疾病控制杂志, 2014, 18(8):693-697,747.

[Hu Y H, Xiao G X, Guo Y, et al. The epidemic features of the hand, foot, and mouth disease during 2008-2011 in China[J]. Chinese Journal of Disease Control & Prevention, 2014, 18(8):693-697,747. ]

[31]
长沙市统计局. 长沙市国民经济和社会发展统计公报2014[EB/OL]. http://tjj.hunan.gov.cn/tjfx/tjgb/szgb/zss_1/201507/t20150717_4326868.html.

[Changsha Municipal Bureau of Statistics. Statistical Bulletin on the Economic and Social Development of Changsha City in 2014[EB/OL]. http://tjj.hunan.gov.cn/tjfx/tjgb/szgb/zss_1/201507/t20150717_4326868.html. ]

[32]
Liu J L. Threshold dynamics for a HFMD epidemic model with periodic transmission rate[J]. Nonlinear Dynamics, 2011, 64(1):89-95. DOI:10.1007/s11071-010-9848-6

DOI

[33]
Ma Y, Liu M, Hou Q, et al. Modelling seasonal HFMD with the recessive infection in Shandong, China[J]. Mathematical Biosciences & Engineering, 2013, 10(4):1159. DOI:10.3934/mbe.2013.10.1159

DOI

[34]
Masucci A P, Serras J, Johansson A, et al. Gravity versus radiation models: On the importance of scale and heterogeneity in commuting flows[J]. Physical Review E, Statistical, Nonlinear, and Soft Matter Physics, 2013, 88(2):022812. DOI:10.1103/PhysRevE.88.022812

DOI

[35]
Simini F, González M C, Maritan A, et al. A universal model for mobility and migration patterns[J]. Nature, 2012, 484(7392):96-100. DOI:10.1038/nature10856

DOI

文章导航

/