地球信息科学理论与方法

跨区域知识迁移的空间预测:两大类方法的对比分析

  • 栾雨芃 , 1, 2 ,
  • 贺日兴 , 1, 2, * ,
  • 姜超 3, 4 ,
  • 邓悦 1, 2 ,
  • 朱孟真 1, 2 ,
  • 王一童 1, 2 ,
  • 唐宗棣 1, 2
展开
  • 1.首都师范大学资源环境与旅游学院,北京 100048
  • 2.首都师范大学 三维数据获取与应用教育部重点实验室,北京 100048
  • 3.首都经济贸易大学城市经济与公共管理学院,北京 100070
  • 4.城市群系统演化与可持续发展的决策模拟研究北京市重点实验室,北京 100070
* 贺日兴(1972— ),男,江西安福人,博士,教授,主要研究方向为犯罪地理和时空大数据等。 E-mail:

栾雨芃(2001— ),女,山东济南人,硕士生,主要研究方向为犯罪地理与犯罪分析。E-mail:

Copy editor: 蒋树芳

收稿日期: 2024-06-23

  修回日期: 2024-09-07

  网络出版日期: 2024-11-07

基金资助

国家重点研发计划项目(2022YFB3903602)

国家自然科学基金项目(42371251)

国家自然科学基金青年项目(42001159)

首都师范大学2024年度实验室开放基金项目(LIP2024S252)

Spatial Prediction Based on Cross-area Knowledge Transfer: Comparison of Two Methods

  • LUAN Yupeng , 1, 2 ,
  • HE Rixing , 1, 2, * ,
  • JIANG Chao 3, 4 ,
  • DENG Yue 1, 2 ,
  • ZHU Mengzhen 1, 2 ,
  • WANG Yitong 1, 2 ,
  • TANG Zongdi 1, 2
Expand
  • 1. College of Resources Environment and Tourism, Capital Normal University, Beijing 100048, China
  • 2. Key Laboratory of 3D Information Acquisition and Application, MOE, Capital Normal University, Beijing 100048, China
  • 3. College of Urban Economics and Public Administration, Capital University of Economics and Business, Beijing 100070, China
  • 4. Beijing Key Laboratory of Megaregions Sustainable Development Modeling, Beijing 100070, China
* HE Rixing, E-mail:

Received date: 2024-06-23

  Revised date: 2024-09-07

  Online published: 2024-11-07

Supported by

National Key Research and Development Program(2022YFB3903602)

National Natural Science Foundation of China(42371251)

Youth Fund of the National Natural Science Foundation of China(42001159)

Open Laboratory Fund of Capital Normal University in 2024(LIP2024S252)

摘要

跨区域知识迁移是在少样本地区开展空间预测的一种重要手段。目前基于迁移学习技术和基于地理学第三定律的跨区域空间预测分别是计算机领域和地学领域的主流方法。本文对2018年以来国内外基于以上两大类方法开展的相关跨区域空间预测研究进行了文献综述,主要工作包括: ① 对比分析了基于地理相似性和基于迁移学习进行空间预测的基本原理及二者的技术流程异同; ② 总结了2类方法在相似性表征指标及相似性度量方法方面的差异; ③ 梳理了2类不同预测方法在常用的辅助数据、空间分析单元、模型方法与评价指标选取方面的差异; ④ 探讨了2类跨区域知识迁移的空间预测方法面临的问题及挑战。研究表明,2类方法的技术思想基本一致,但在适用范围、相似性表征与度量、相关辅助变量及参数选择等方面均存在一定局限性。研究可为两类方法优化完善及有效融合、跨区域预测方法的创新、应用领域的扩展等提供有益参考。

本文引用格式

栾雨芃 , 贺日兴 , 姜超 , 邓悦 , 朱孟真 , 王一童 , 唐宗棣 . 跨区域知识迁移的空间预测:两大类方法的对比分析[J]. 地球信息科学学报, 2024 , 26(11) : 2465 -2482 . DOI: 10.12082/dqxxkx.2024.240365

Abstract

Due to the imbalanced regional development, data scarcity exists in some regions, which to some extent restricts the progress of spatial prediction research. The introduction of cross-area knowledge transfer offers a valuable method for mitigating the impact of data scarcity in areas with limited samples and for conducting spatial prediction. With technological advancements, spatial prediction methods based on transfer learning and the Third Law of Geography have become mainstream in the fields of computer science and geography. Transfer learning techniques leverage knowledge from a source domain with abundant data to solve related tasks in a target domain with limited data. Meanwhile, the proposal and application of the Third Law of Geography show that by comparing the similarity of geographical environmental variables between sampled regions and unsampled regions (rather than relying solely on traditional spatial distance or quantitative relationships), it is possible to predict target information in unsampled regions using a small amount of sample data. This provides a theoretical basis and methodological reference for selecting the source domain and target domain in cross-regional knowledge transfer. This paper conducts a literature review of cross-regional spatial prediction research based on these two major methods since 2018, focusing on the following key tasks: (1) Comparing and analyzing the basic principles of spatial prediction based on geographical similarity and transfer learning, and identifying differences in their technical procedures; (2) Summarizing the differences in similarity representation indicators and measurement methods between the two approaches; (3) Examining differences in commonly used auxiliary data, spatial analysis units, modeling methods, and evaluation indicators between the two prediction methods; (4) Discussing the challenges and limitations faced by these cross-regional knowledge transfer methods. The study shows that while the technical principles of both methods are basically consistent, they have specific limitations regarding their scope of application, similarity representation and measurement, relevant auxiliary variables, and parameter selection. The research offers useful insights for optimizing and improving these methods, integrating them effectively, innovating cross-regional prediction approaches, and expanding their application fields.

1 引言

预测是人们利用已经掌握的知识和手段,预先推测和判断事物未来发展状况的一种活动。目前,结合地理数据空间位置属性的空间预测在地学领域已得到广泛应用,如灾害预测[1-3]、资源分布预测[4-6]、生态环境质量预测[7-8]、犯罪预测[9-11]等。空间预测不仅可以针对地理空间,还可以是社会空间和虚拟空间。因信息化发展水平的不平衡性及数据共享开放程度的不同,部分区域存在数据质量低、数据量少或数据无法获取等问题,一定程度上限制了这些区域空间预测研究与应用的正常开展[12]。以犯罪预测研究为例,基于大数据和深度学习的犯罪预测技术是当前国际预测性警务研究的前沿热点[9],但我国公安机关犯罪数据不对外开放共享,广大科研院校不具备开展犯罪预测实证研究及模型训练所需的大规模犯罪数据条件,严重制约了我国在这方面的研究及应用发展[13]。针对上述问题,人们基于心理学界提出的知识迁移思想[14],尝试在空间预测时将从数据丰富地区学习到的知识迁移使用至数据稀缺地区,以削弱数据稀缺性对应用研究带来的影响[15]
目前,有关跨区域知识迁移的空间预测方法研究与应用,主要集中在计算机和地学2个领域。在计算机领域,主要通过构建迁移学习模型,将从源域学习到的知识迁移至目标域来实现跨域空间预测。该方法现已被成功应用于跨城市人群流量预测[16-17]、交通预测[18-20]、犯罪预测[21-23]等方面。但早期的迁移学习模型未准确量化源域与目标域间相似性,容易因研究人员错误选择源域与目标域,引起负迁移现象[24]。后来杨强等[18]于2018年提出的融合城市间相似性度量方法的迁移学习模型 RegionTrans优化了负迁移现象,该研究充分说明了在迁移学习中引入区域相似性度量并进行区域匹配的重要性[17]。在地学相关领域,主要基于地理学第三定律,通过比较两区域间地理环境的相似性,使用高相似度的已知区域的地理特征及知识,来推测对应的未知区域的地理特征值。地理学第三定律(亦称地理相似性规律)由我国地理学领域学者朱阿兴等[25]于2018年提出,目前多用于自然地理领域,如土壤空间推测制图[26-29]、生物入侵预测[30-31]、泥石流易发性预测[32-33]、森林火灾预测[34]等。该定律的提出,为跨区域知识迁移的空间预测研究中源域与目标域的区域相似性度量提供了重要理论支撑。
因地理学第三定律和首个强调区域相似性匹配的迁移学习模型均在2018年提出,本文选择2018年以来国内外学术文献数据库中跨区域空间预测相关文献进行了系统综述,以期梳理2种不同跨区域预测技术的原理、技术思路、模型方法的各自特点与异同,为将其拓展应用至更多领域提供有益参考。主要工作包括4个方面: ① 介绍了2种不同技术的基本原理并对比了两者的技术流程异同;② 总结了2种不同技术的相似性表征指标和度量方法; ③ 梳理了2种不同预测技术的常用辅助数据、空间分析单元、模型方法与评价指标; ④ 探讨了现有跨区域知识迁移的空间预测方法面临的问题及挑战。

2 文献来源与分析

2.1 文献来源及范围界定

本研究以Web of Science、谷歌学术和中国知网数据库作为主要资料来源,参照PRISMA指南[35]中的方法,对2018年以来(截至2024年7月31日)跨区域空间预测相关中英文文献进行筛选:
(1)文献检索。分别建立计算机领域和地学领域的中英文关键词组合(表1),同一组合内的关键词之间为“或”关系,多个关键词中只需出现一个即可,如只出现“跨区域”或“跨城市”的文献都会被检索。在检索策略上,由于地理相似性的文献相对较少,直接按关键词进行检索;但计算机领域由于每个关键词所对应的文献数量众多,因此,为提高检索效率,设置了3个关键词组合,检索时不同组合间为“和”关系,即在文献中要同时出现3个组合内的某一个关键词。以中文关键词组合为例,当文献中同时出现“跨区域”和“知识迁移”和“预测”时才会被检索,以此类推同时出现“跨城市”和“迁移学习”和“预测”的文献也会被检索到。按此检索策略,在Web of Science、谷歌学术和中国知网数据库中检索相关SCI、SSCI、EI、北大中文核心期刊论文、会议论文和硕博毕业论文。删除重复文献后,共检索到10 293篇,其中中文4 842篇、英文5 451篇。
表1 文献检索中的中英文关键词组合

Tab. 1 Combination of Chinese and English keywords in literature retrieval

研究方法所属领域 英文关键词组合 中文关键词组合
计算机领域 "cross-city" "cross-domain" "cross-area"; "跨区域"、"跨城市";
"knowledge transfer" "transfer learning"; "知识迁移"、"迁移学习";
"prediction" "forecast" "预测"
地学领域 "environmental similarity" "third law of geography" "地理相似性"、"环境相似"、"地理学第三定律"
(2)文献粗筛。快速浏览文献标题、摘要和关键词,按照以下标准进行筛选: ① 研究内容与空间预测相关; ② 知识迁移应为跨地理空间区域的迁移。剔除医学图像解译、生物信息追踪、心理情感分析、学科教育迁移、机械零件损坏判定、遥感影像识别分类等诸多在数据特征域而非地理空间域间进行知识迁移的文献,筛选出文献192篇,其中中文77篇、英文115篇。
(3)文献精选。对粗筛文献进行通读,删除研究区及研究内容不明确、粗筛阶段未排除的主题不相关文献,以及在研究方法中未对源域与目标域进行地理环境相似性计算或区域匹配的文献。最终获得文献75篇,其中中文19篇、英文56篇。从文献类型来看,含期刊论文51篇、会议论文14篇、学位论文10篇;从研究方法来看,含迁移学习方法论文46篇、地理相似性方法论文29篇。

2.2 文献分析

从文献数量上看,如图1所示,自2018年以来,跨区域空间预测研究与应用方面的文献总量呈逐年递增的态势。其中,基于迁移学习方法进行跨区域空间预测的文献数量在2020年后迅速增多,并持续上升。基于地理相似性的方法由于仍处于起步阶段,每年发表的文献数量相对较少,以2020年最多,这可能与2018年地理学第三定律被提出后,提出者团队发表了多项验证该定律普适性的应用研究成果有关[28-29,36]
图1 2018年1月1日—2024年7月31日跨区域知识迁移空间预测文献数量

Fig. 1 The number of papers on spatial prediction of cross-area knowledge transfer from Jan.1 2018 to July 31, 2024

从文献关键词来看,如图2(a)所示,在基于迁移学习方法的文献(46篇)中,“迁移学习(Transfer Learning)”作为基础方法名称,在32篇文献中作为关键词出现,使用频率最高。同时,因相关研究多为跨城市预测,故“Urban areas”“Predictive models”也具有较高的使用频次。在基于地理相似性方法的文献(25篇)中,因文献数量相对较少,高频关键词多样(图2(b))。可能因地理相似性规律提出者团队早期发表的多个文献均与土壤推测制图有关的缘故,“数字土壤制图(Digital soil mapping)”与“地理学第三定律(Third Law of Geography)”“环境相似性(Environmental similarity)”“Spatial prediction”等关键词一样,出现频率较高。此外,判断已知样本点的可信度及评价目标域未知点预测值的不确定性通常是此类研究的必要环节,因此“可信度”在一些文献中也常作为关键词出现。
图2 文献中英文关键词词频云图

Fig. 2 Word cloud of English and Chinese keyword frequencies in the literature

3 两类预测方法的基本原理和技术流程及对比

3.1 基本原理及对比

地理相似性规律由Zhu等[25,37-39]提出,也被称为地理学第三定律,认为:“两个地点(区域)的地理环境配置越相似,地理特征就越相近”,即两个空间位置在地理环境(包括空间和非空间要素)上的综合相似性越高时,两者的地理特征(所关注的目标地理变量)越相似,且两个位置在空间上不一定相衔接。该定律的应用对样本量大小及其分布、所构建的目标地理变量的空间关系模型的全局适用性等没有特殊要求,而更关注每个样本的代表性,并通过比较样本所在地与未知点的地理环境(地理要素构成)的相似性,来实现目标地理变量的空间估值并测度其结果的不确定性[39]。该定律的提出,为空间预测分析提供了一种新思路和新方法,也为基于小样本或离散型数据(如犯罪事件)进行跨区域空间推测提供了重要理论支持。
基于地理相似性的跨区域空间预测方法其核心思想是在度量2个区域间地理环境相似性基础上,将从样本区的采样数据、社会经济及地理环境等数据中学习到的知识迁移至未知区,实现跨(采样)区域空间推测。
迁移学习是机器学习领域的一个重要分支,它通过转移不同但相关的源领域中所包含的知识,以提高学习对象在目标领域中的表现[40]。通过这种方式,可以减少构建目标域模型时对大量数据的依赖,因此为在小样本区域开展空间预测提供了新的方法与手段。
迁移学习过程定义[15]如下:给定一个源域Ds及对应的源任务Ts,一个目标域Dt及目标任务Tt,当Ds≠Dt(但Ts与Tt相同或相关)或Ts≠Tt(但Ds与Dt相同或相关)时,可以利用Ds和Ts的信息,更好地完成Dt的任务Tt。迁移学习需要解决的核心问题是找到目标域任务和原域任务之间的关联性和相似关系,进而实现知识在不同域之间的迁移。一般来说,源领域和目标领域之间的关联性和相似性越强,那么迁移学习的效果就会越好。
基于迁移学习的空间预测方法其核心思想是将基于源域海量数据训练好的模型、参数等知识,迁移应用至目标域,结合目标域中少量样本数据进行模型微调,从而实现跨区域知识迁移及空间预测。

3.2 预测技术流程及对比

与基于地理相似性的空间预测类似,许多改进后的基于迁移学习的跨区域空间预测方法也引入相似性匹配环节以提升预测效果。通过梳理文献,总结出基于地理相似性和基于迁移学习2种不同跨区域空间预测方法技术流程对比图(图3)。
图3 基于地理相似性和基于迁移学习的跨区域空间预测方法技术流程对比

*注:图中颜色加深的流程框为2种方法间存在差异的步骤。

Fig. 3 Comparison of technical processes for cross-area spatial prediction methods based on geographic similarity and transfer learning

图3可看出,在技术流程上,二者大体均遵循以下5个步骤:① 研究区及空间分析单元选择; ② 数据获取及处理; ③ 相似性度量及源域目标域匹配; ④ 目标域特征空间预测; ⑤ 预测结果评价。基于地理相似性(前者)和基于迁移学习(后者)的空间预测方法不同点如下。
(1)在研究区选择时,前者在目前许多自然地理领域应用中通常选择一个研究区,但也有少量文献选择多个研究区并各自独立研究,以证明方法在各区域的普适性。相应地,在跨区域定义方面,前者多指跨样本区,即根据研究区内是否存在样本情况,划分为样本区与未知区。而后者多为跨省、市、县等具有明确地理边界的空间预测,因此至少选择2个及以上的研究区。
(2)在确定迁移方向时,前者将从样本区(源域)学习到的知识迁移至未知区(目标域)内进行预测;后者以数据丰富的一个或多个研究区作为源域,并将从源域中学习到的知识迁移至数据稀缺的目标研究区(目标域城市)进行预测。
(3)在确定理论依据时,前者强调基于地理学第三定律对目标域与已知样本域间进行相似性假设,即假设两区域间地理环境相似性越高其地理特征越相似;而后者未提出明确的理论依据。
(4)在筛选辅助数据时,前者强调地理特征受相关地理环境的影响,故采用地理环境数据进行相似性度量;后者则分为不使用辅助数据和使用辅助数据2种方法,其中不使用辅助数据的方法直接基于源域与目标域间目标数据的相似性建立源域与目标域的对应关系,而使用辅助数据的方法与基于地理相似性的方法流程类似。
(5)在构建模型进行空间预测时,前者通过设定阈值,保留与每个未知格网的相似性大于阈值的样本格网作为源域,然后根据综合相似度值与样本地理特征值计算得到未知区预测值,方法简单且对样本量需求较少;后者遵循“预训练(pre-training)+微调(fine-tuning)”的机器学习常用模式,首先在源域城市利用丰富的历史数据和辅助数据预训练得到一个较好的预测模型,然后结合目标域城市的少量历史数据及辅助数据,对模型参数微调以提升迁移学习模型预测精度,因此,后者通常不适于在无样本区域开展预测。
(6)在进行精度评价时,前者往往只评价自身预测精度;后者常通过与多个现有模型进行比较,来证明该模型在性能、精度等方面的优势。

4 预测的空间分析单元选择及对比

空间分析单元是地学统计、时空分析、机器学习建模中都需要设定的一个基本参数。空间分析单元类型及其大小的选择,与所使用的分析方法及具体应用方向密切相关,相关文献所使用的空间分析单元情况如表2所示。
表2 文献采用的空间分析单元情况统计及对比

Tab. 2 Statistics of spatial analysis units adopted in the literature

研究方法 空间分析单元
类型及大小
使用频率/% 应用方向
地理相
似性
10 m×10 m方形格网 15.0 土壤推测制图[29,41-42]
30 m×30 m方形格网 25.0 缺失数据采样[33,43]
土壤推测制图[28,44]
城市变迁规律[45]
90 m×90 m方形格网 15.0 土壤推测制图[26-27,41]
1 km×1 km方形格网 15.0 生物分布预测[36]
负样本生成[34]
土壤推测制图[46]
8 km×8 km方形格网 5.0 降水量估算[47]
20 km×20 km方形
格网
10.0 负样本生成[30-31]
0.15°×0.15°格网 5.0 生物分布预测[48]
0.25°×0.25°格网 10.0 作物生长状况
推测[49-50]
迁移学习 500 m×500 m方形
格网
13.3 人群流量预测[16]
交通预测[51]
1 km×1 km方形格网 33.3 交通预测[12,52]
人群流量预测[17,53]
2 km×2 km方形格网 6.7 交通预测[54]
3 km×3 km方形格网 6.7 犯罪预测[22]
社区 13.3 犯罪预测[21,23]
路网 26.7 交通预测[55-58]
在分析单元类型选择上,以正方形格网的使用频率最高,在34篇分析单元交代明确的文献中占25篇。但在基于迁移学习的交通预测研究中,也有一些文献采用路网作为分析单元。
在分析单元大小选择上,由于迁移学习常用于跨行政区域预测,研究区域范围广,多采用较大的公里格网以提升运算效率及预测精度。在目前两项基于迁移学习的跨区域犯罪预测研究中,采用社区或公里格网作为空间分析单元,要大于犯罪地理学领域在犯罪时空预测应用中常用的200 m×200 m左右格网单元[9]。基于地理相似性的应用目前仍较少,不同应用方向的空间分析单元大小具有明显差异,其中具代表性的土壤推测制图研究多采用 10~90 m的较小格网单元,而生物分布预测、负样本生成等研究则多使用大型公里格网或经纬度格网。

5 区域相似性表征辅助数据选择与度量方法及对比

5.1 表征相似性的辅助数据选择

不同目标地理变量会受到多种不同因素的共同影响,2个空间位置之间的相似性需要利用目标地理变量的相关影响因子来衡量。如表3所示,因学科不同,研究内容不同,基于地理相似性和基于迁移学习的方法在表征跨区域环境相似性的辅助数据选择上也有所差别。
表3 文献中表征相似性的常用辅助数据使用情况

Tab. 3 Commonly used auxiliary data for representing similarity in the literature

研究
方法
应用方向 表征相似性的辅助数据
地形 气候 地质因子 生物因子 POI 路网结构 其他
地理
相似性
土壤预测制图[26-29,41-42,44,46] 海拔、
坡度、
坡向、
平面曲率、
剖面曲率、
地形湿度指数(TWI)
……
温度、
降水量、
水分指数
……
母质类型 归一化植被指数(NDVI) - - 土地利用类型、
土地覆盖类型、
LSDF数据集
负样本生成/缺失数据采样[30-34,43] 海拔/高程、
坡度、
坡向、
平面曲率、
剖面曲率
……
温度、
相对湿度、
降水量、
气压、
风速、
日照时数
岩土体类型、
断层密度、
水系密度
植被类型、
植被覆盖度、
归一化植被指数(NDVI)
- 道路密度 人口数据、
土地利用类型、
土地覆盖类型、
……
作物生长相关推测[49-50] 高程、
坡度、
地形起伏度
温度、
降水量
- - - - 经纬度
生物分布预测/生物入侵预测[36,48,59-60] 海拔 温度、
相对湿度、
降水量、
日照时数
……
- 化学元素同位素值 - - 经纬度
降水量估算[47] - 相对湿度、
降水量
- - - - -
城市变迁规律[45] 高程、
坡度
- 河流 归一化植被指数(NDVI) - 各级路网分布 人口、
国民生产总值、
土地利用类型
迁移
学习
交通预测[12,18 -20,51-52,54-57,61 -79]
- 温度、
天气、
降水量、
能见度
……
- - 各类POI总数、
POI类别向量、
POI信息熵
路网结构、
路网类型
·……
日历数据、
人口数据、
卫星灯光数据、
商业中心分布
……
人群流量预测[16-17,53,80-82] - 温度、
湿度、
风速
- - 各类POI总数 道路总长度、
公共交通站
点数量
建筑类型、
签到数据
……
犯罪预测[21-23] - 天气 - - 各类POI总数 - 签到数据、
人口数据、
警察局分布、
出租车移动性
基于地理相似性的空间预测研究与应用目前主要集中在自然地理、生态环境等领域,常使用地形、气候、生物因子等地理环境数据。其中,地形和气候对土壤发育、植被生长、动物栖息、自然灾害等都存在影响,因此这两类数据在研究中普遍使用。但当研究区较小或地形平缓地区时,气候与地形条件的差异性往往较小,因此需要根据研究内容补充特异性因子。例如:土壤母质数据作为土壤形成的物质基础是影响土壤空间推测制图研究的重要因子,但因其获取困难,常用土壤类型或地质类型代替;生物因子包括植被、动物、微生物因子等,其中在土壤推测制图中根据植被类型或生长状况来表征土壤差异性,在森林火灾负样本采样中通过植被类型和覆盖率来表征不同位置的易燃性,在鼠疫传播预测中使用鼠宿主密度来表征跳蚤分布情况。因应用领域的局限性,目前相关研究辅助数据重复性较高,且多为连续变量,易于获取与度量,而对离散变量辅助数据的使用则相对较少。因此,加强对离散变量的使用和相似性度量方法研究,对扩展该方法在人文地理等更多领域的应用具有重要意义。
基于迁移学习模型的跨区域空间预测已应用于人群流量预测、交通预测以及犯罪预测,常使用建成环境(POI、路网结构等)、城市建筑、气候等城市环境相关数据。其中,气候数据和路网结构可用来表征人群出行时所选择的交通出行方式,不同区域POI分布数量或密度可用于表征城市功能分区。但在数据选择和使用时,大部分来自计算机领域的研究人员通常不会考虑不同环境因子对不同目标变量影响的作用尺度及空间异质性问题,一定程度上会降低相似区域匹配的精度。目前基于迁移学习模型的空间预测研究与社会经济发展情况密切相关,辅助数据更加多样化,离散数据也使用较多,其在相似性表征和度量方面的研究成果,可为将地理相似性使用至辅助数据更加繁杂的人文地理领域提供有益参考。

5.2 相似性度量方法及对比

相似性度量是使用相关函数比较形状、图像、信息或数据相似性的过程[83],用于对表征相似性的环境因子配置进行测度,判断源域与目标域间相似性。
相似性量化计算是基于地理相似性相关研究的核心,旨在求算每个已知样本点对研究区内其他每个点的代表性,并通过未知点与已知样本点各自的地理环境组合间的综合相似性来度量[38],其原理如图4所示。在确定好地理环境数据后,首先采用不同的计算方法来求得未知点与已知样本点间的环境相似性(表4):对于离散变量,多采用概率密度函数或自定义的度量函数(衡量离散数据值是否相等,相等则记为1,即相似,反之则记为0,即不相似);对于连续变量,常采用概率密度估计函数等计算方法。然后,将计算得到的单一环境变量相似度,采用平均值法、最小限制因子法、线性加权法等方法[34]计算出样本点与待预测点间地理环境组合的综合相似性,即个体代表性。
图4 地理相似性度量原理示意图[38]

注:图中Sik是样点k对点i的个体代表性,即样点k的地理环境组合与点i的地理环境组合的相似程度。

Fig. 4 Schematic diagram of the principle of geographic similarity measurement[38]

表4 单一辅助数据的相似性度量常用方法

Tab. 4 Common methods for similarity measurement using a single auxiliary data

研究
方法
数据
类型
相似性度量方法 公式
编号
应用方向 公式变量注释
地理
相似性
连续
变量
核密度估计法 缺失数据采样[33]
负样本生成[31-32,34]
K均值聚类法 植被元素含量估测[84]
自定义方法:
E v ( e v , i j , e v , k ) = e x p - e v , i j - e v , k 2 2 × S D v S D v   t o   e k S D v 2
(1) 土壤推测制图[42-44]
城市变迁规律[45]
Ev(ev,ij, ev,k)表示ev,ijev,k两点间第v个环境协变量的相似性;ev,ijev,k分别表示第v个环境协变量在(ij)点和样本点k处的值;SDv为研究区第v个环境协变量的标准差;SDv to ek为未访问位置点(ij)的第v个环境协变量值与k个样本点的环境协变量值的均值偏差的平方根
离散
变量
概率密度函数 缺失数据采样[33]
负样本生成[31]
频率比法 负样本生成[32,34]
自定义方法:
E v ( e v , i j , e v , k ) = 0 ,           e v , i j e v , k 1 ,           e v , i j = e v , k
(2) 土壤推测制图[42-44] Ev(ev,ij, ev,k)表示ev,ijev,k两点间第v个环境协变量的相似性;ev,ijev,k分别表示第v个环境协变量在(ij)点和样本点k处的值。
迁移
学习
连续
变量
最大均值差异算法(MMD) 公共设施分布预测[52]
KL散度 公共设施分布预测[52]
犯罪预测[23]
Jaccard相关系数 公共设施分布预测[52]
Pearson相关系数 人群流量预测[16,53]
交通预测[12]
犯罪预测[22]
余弦相似度 交通预测[51,68,71]
迁移学习中的相似性度量则更倾向于对源域与目标域开展区域匹配。迁移学习模型通过特征提取器将目标域与源域中的空间特征提取至同一维度并衡量两者之间的相似性,常用度量方法见表4。与地理相似性的度量方式类似,汇总各单一辅助数据的相似性计算结果得到综合相似性,对于相似性高的区域赋更高权重以突出其在区域匹配中的作用。此外,模型还使用区域间特征的相似性优化迁移学习模型参数,以提升预测精度。

6 跨区域空间预测方法与模型及对比

6.1 基于地理相似性的空间预测方法

基于地理相似性的空间预测方法通常包含地理相似性度量和空间预测2个方面。其中相似性度量方法在5.2节中已有详细介绍。
空间预测主要包括预测不确定性分析及空间预测模型设计2个部分。预测不确定性用于表征预测值的可信度。每个未知区域目标地理变量预测值的不确定性与该位置和已知样本的环境相似性成反比,即:当相似性越高时,不确定性越低。量化未知点预测不确定性的公式如下[26-28]
U n c e r t a i n t y i j = 1 - m a x S 1 , S 2 , ,   S N
式中:Uncertaintyij为未知点ij的预测不确定性值;ij为格网单元的行列号;SN为第N个样本点对未知点 i j的相似性。对未知点的预测应充分考虑到这种不确定性,即如果与未知格网最相似的采样格网的不确定性超出不确定性阈值时,那么说明现有采样区中没有一个样本所在格网可以足够充分地代表该未知格网并进行有效的预测,那么此时这些格网将会被记为“无数值”,即不可预测的格网。对于可预测的格网,保留每个未知格网对应的相似性大于相似性阈值(相似性阈值=1-不确定性阈值)的采样格网,然后利用设计的空间预测模型计算得到最终预测值。
基于地理相似性的空间预测模型,目前主要有自定义模型及与机器学习相结合的模型2种:
(1)自定义空间预测模型。地理相似性作为基础理论指导空间预测,通常需要结合地理环境相似性值自定义一个空间预测函数。1997年朱阿兴等[85]最早提出的基础预测模型函数公式如下:
V i j = j = 1 k S i j , k V k j = 1 k S i j , k
式中: ij为未知点所在格网的行列号; Vij为未知点ij的预测值; Sij,k为未知点ij与已知样本点k间的综合相似性; Vk为已知样本点k的地理特征值。该模型已被广泛应用在土壤空间推测制图研究,如 SoLIM模型框架[85]和iPSM模型框架[86]。此外,也有研究者探索性将该模型用于水稻分布[48]、降水量估算[47]、玉米播种期[50]等研究。地下水水位预测是该模型在动态空间预测方面的首个应用,应用涉及的地理环境变量多样,但仍获得了优于常用机器学习模型的预测效果[60],表明基于地理相似性的方法能够在样本数据稀疏且地质条件复杂的情况下对动态地理变量仍具有较好的预测效果。以上相关探索性应用研究,进一步验证了地理相似性理论在更多应用方向的普适性。
部分研究还考虑到与目标地理特征相关的非地理环境数据的影响,在上述基础预测模型中又补充了其他特异性权重因子,以提升模型精度和可解释性。例如,在跳蚤指数预测[36]中,当可用样本格网数量增多时,未知格网的预测精度普遍会更佳,因此可通过增加特异性权重因子g(即每个未知格网ij与样本格网k的环境相似性超过阈值的样本格网数量)来削弱样本数量不同所带来的差异性。Qin等[41]提出的SoLIM-IDW模型则结合地理学第一定律[87],以计算得到的未知格网与已知样本格网间的反距离加权值Dij,k作为权重因子。
此外,Fan等[27]提出的iPSM_WCovar_limit模型,补充衡量了地理环境数据是否适用于度量未知格网与已知样本格网间相似性,用以辅助重新筛选不同情景下的地理环境数据,以提升模型预测精度。例如,当未知格网是山区,但已知样本格网是平原时,如果仍采用相同的地理环境数据衡量两地相似性,可能会导致预测误差较大。
(2)与机器学习相结合的模型。即通过与现有成熟机器学习模型联合使用,以提升模型预测精度,同时也能够避免现有机器学习模型易受到辅助数据质量影响的问题[29]。如朱阿兴等[29]在一项土壤空间推测制图研究中,提出了一个将地理相似性与随机森林模型联合的集成模型,研究选择12类地形因子作为地理环境数据进行相似性度量,将土壤样本数据和通过相似性计算得到的未知区与已知样本区之间的相似性值输入随机森林模型,来预测未知区域格网的土壤类别。集成模型的总体准确度达71.79%,高于地理相似性模型的58.97%和随机森林模型的66.67%。Lin等[88]在一项空气质量预测研究中,提出了一种将第三地理学定律与SAM-CNN-Transformer相结合的预测方法,通过结合监测站间的地理环境特征提高了空气质量预测的准确性。该研究实验结果表明,仅考虑地理环境相似性的模型预测精度(RMSE=2.193)高于仅使用气象数据的模型预测精度(RMSE=2.505),但以二者同时考虑的预测效果(RMSE=2.168)为最优。这些研究表明,将地理相似性与机器学习模型联合可提高预测精度。

6.2 基于迁移学习的空间预测方法

目前,研究者基于迁移学习技术,已在跨区域人群流量预测、交通预测、犯罪预测等方面提出了许多成熟的应用模型,其中的代表性模型如表5所示。
表5 不同应用方向基于迁移学习的跨区域空间预测代表性模型

Tab. 5 Representative models of cross-area spatial prediction based on transfer learning in different application directions

应用
方向
模型/框架名称 研究区 迁移
方向
数据集 评价指标 预测精度
目标数据 辅助数据
人群流量预测 跨城市深度时空迁移学习方法
RegionTrans[17]
A-Match 华盛顿(A)
芝加哥(B)
20×20 km
中心城区
A→B 自行车流量 签到数据 RMSE=0.576 相较最优基线模型最大减少了10.7%的预测误差
S-Match RMSE=0.594
融合注意力机制的时空深度域适应网络模型ST-DAAN[82] 成都(A)
北京(B)
纽约(C)
芝加哥(D)
A→B 出租车上下车点位 节假日、
天气特征
归一化后
RMSE=0.060
相较RegionTrans模型最大减少了35.8%的预测误差
D→C 自行车起点终点 归一化后
RMSE=0.021
交通
预测
时空图少样本学习框架
ST-GFSL[58]
洛杉矶(A)
成都(B)
深圳(C)
旧金山湾区(D)
A+B+C→D 高速公路
交通指数
RMSE=1.865 相较最优基线模型最大减少了3.4%的预测误差
选择性跨城市迁移学习框架CrossTReS[71] 华盛顿(A)
芝加哥(B)
纽约(C)
B→A 出租车上下车点位 道路数据、
POI数据
RMSE=0.867 相较最优基线模型最大减少了8%的预测误差
C→A RMSE=2.177
B→A 自行车起点终点 RMSE=2.211
C→A RMSE=3.880
基于区域参数生成的交通事故预测跨城市知识迁移模型CARPG[54] 芝加哥(A)
纽约(B)
纳什维尔(C)
B→C 交通事故 出租车数据、
天气数据、
日历数据、
POI数据
RMSE=9.010 相较最优基线模型最大减少了11.97%的预测误差
B→C RMSE=17.220
犯罪
预测
梯度提升算法
Gradient Boosting[23]
哈利法克斯(A)
多伦多(B)
温哥华(C)
B+C→A 犯罪数据 人口普查范围数据、
人口数据、
路灯数据、
POI数据、
签到数据等
AUC=70.520 平均提升了4.0%的AUC分数
无监督领域自适应模型
UDAC[22]
纽约(A)
芝加哥(B)
洛杉矶(C)
A→B 犯罪数据 气象数据、
POI数据、
警察局分布、
出租车移动性
RMSE=0.618 优于所有基线模型
B→A RMSE=0.652
A→C RMSE=0.626
C→A RMSE=0.635
B→C RMSE=0.813
C→B RMSE=0.809
在人群流量预测方面,主要的预测模型有RegionTrans[17]、ST-DAAN[82]、RegionRep[53]、AreaTransfer[16]、MGAT[62]等,前2个为比较知名的代表性模型。其中,RegionTrans模型由杨强团队[17]提出,是最早在区域匹配过程中量化区域相似性的迁移学习模型。该模型设计城际区域匹配函数,对目标城市与源城市进行相似性匹配,通过神经网络提取区域级特征,优化目标城市的网格参数进行空间预测,最大可减小10.7%的预测误差;在同一数据集下,使用长时序辅助数据进行相似区域匹配的A-Match模型比使用短期流量数据进行相似匹配的S-Match模型减小了4.9%的预测误差,验证了辅助数据在区域相似性匹配中的重要性及必要性。融合注意力机制的时空深度域适应网络模型(ST-DAAN)由Wang等[82]提出,该模型利用ConvLSTM网络学习输入数据的高维特征表示,将其映射到同一个高维空间中,使用最大均值差异缩小源域和目标域间数据分布差异,以辅助目标域进行预测。该模型相较于RegionTrans模型减少了35.8%的预测误差。目前, RegionTrans和ST-DAAN模型常用作人群流量预测研究中的基线模型,并被拓展应用至交通预测研究中。
交通预测涉及交通速度预测、交通流量预测、交通事故风险预测等,主要的预测模型有ST-GFSL[58]、CrossTReS[71]、CARPG[54]、TEEPEE[75]、CCMHC[63]、Mest-GAN[66]、SF-HGTL[56]、RiskTrans[51]等,前3个为比较知名的代表性模型。其中,时空图少样本学习框架(ST-GFSL)由Lu等[58]提出,它以城市道路网作为基本单元,利用元知识实现跨城市特征提取,设计参数匹配机制利用相似节点进行知识迁移,预测结果减小了3.4%的预测误差;CrossTReS模型由Jin等[71]提出,模型可自适应地对源域进行重新加权,赋予有利于目标域预测的源域更高权重,最大可减少8%的预测误差;CARPG模型由Yang等[54]提出,模型设计了“城市间全局图知识迁移”模块来学习源城市和目标城市的空间特征并建立跨城市区域连接,然后通过学习特定区域的交通事故模式对模型并进一步微调。当目标域的数据量越大时预测精度越好,最高可减小11.97%的预测误差。
在跨区域犯罪预测研究方面,目前的研究还比较少。Bappee等[23]首次将迁移学习用于犯罪预测,考虑到单一源域可能引起负迁移并使模型性能下降,提出以多伦多和温哥华2个城市作为源域,使用现有Gradient Boosting模型预测哈利法克斯市的犯罪情况,最终在社区尺度下犯罪预测精度提升了4%; Zhou等[22]设计了一个无监督领域自适应模型,基于相似的源城市区域构建目标城市的辅助上下文数据,并采用无监督域自适应的密集卷积网络,学习高层特征以准确预测犯罪风险,在纽约、芝加哥、洛杉矶3个城市间相互迁移的预测精度均优于所有基线模型。

6.3 模型评价方法

表6所示,在预测模型精度评价方面,2种方法所使用的精度评价指标大体相同。其中,基于地理相似性的方法最常使用的指标有均方根误差(RMSE)、平均绝对误差(MAE)、决定系数(R2)等;基于迁移学习的模型最常使用的指标有均方根误差(RMSE)、平均绝对误差(MAE)、平均绝对百分比误差(MAPE)、均方误差(MSE)等,以RMSEMAE的使用频率最高,都超过50%。在2种预测方法中,RMSEMAE 2个评价指标通常会同时使用,文献达33篇。
表6 精选文献中的常用精度评价指标

Tab. 6 Common accuracy evaluation indicators in selected literature

研究方法 精度评价指标 文献数/篇 使用频率/%
地理相似性 RMSE 12 40.0
MAE 11 36.0
R2 5 16.0
迁移学习 RMSE 34 73.9
MAE 27 58.7
MAPE 17 37.0
MSE 3 6.5

7 跨区域空间预测面临的问题与挑战

近年来,跨区域空间预测作为弥补目标区域数据量少或样本质量低问题的重要手段,越来越受到国内外学者的关注与重视。从前述分析表明,计算机领域基于迁移学习的方法和地学领域基于地理相似性的方法,二者在技术实现思路和流程上有共通的地方,但也并不完全一致,各自均存在一定不足和局限性。其中,迁移学习为解决数据稀缺地区的时空预测提供了新思路,但由于缺乏地理学等方面的专业知识支持,相关研究和应用仍存在以下局限性。
(1)迁移学习在较小空间分析单元中的适用性亟待研究。目前迁移学习多采用公里格网,空间分析单元普遍较大,没有考虑数据在不同区域分布的空间异质性问题,研究结果也不利于辅助决策应用。例如,现有基于迁移学习的犯罪预测研究多采用公里格网,远大于犯罪地理学领域常用的200 m左右格网,研究结果很难直接为警方开展精细化的巡逻防控组织提供有效支撑。
(2)有待结合地理学或相关领域的专业知识,对因变量数据进行精细化分类和选择。目前计算机领域迁移学习方法在选择因变量数据时,没有考虑同一个数据集中不同类别的数据可能存在时空分布及其影响因素的差异性。例如,现有基于迁移学习的方法,将所有犯罪数据作为研究对象开展空间预测。但犯罪地理学研究表明,不同类型的犯罪,其空间分布和主要影响因素可能完全不同。
(3)辅助数据选取的依据及合理性有待进一步探讨。现有基于迁移学习的方法在进行相似区域匹配时,通常选取气象、POI总量等普适性数据,忽略了对该辅助数据与目标地理变量的相关性及可解释性方面的衡量。如不同类型POI对目标变量的影响,有的可能是正向的,有的是负向的,直接采用POI总量,在一定程度上可能会降低预测结果的精度和准确性。
而地理相似性理论的提出,为基于小样本数据实现对无样本区域特征的空间推测提供了新思路和解决方案。但基于地理相似性的空间预测方法目前仍局限应用在自然地理等相关领域。与自然地理环境相比,人文地理环境除自然环境因子,还包括建成环境因子、社会经济因子、人口流动因子等具有多样性、动态交互性和复杂性等特点的多方面要素。因此,如何有效地将地理相似性方法成功应用到人文地理学领域,仍面临巨大挑战,需解决以下系列问题:
(1)人文地理地理特征的跨地域共性影响因子仍有待进一步研究与验证。以犯罪为例,犯罪地理学作为人文地理学的一个重要分支,国内因受犯罪数据难以获取的制约,少数团队开展的犯罪影响因子分析实证研究大多针对特定城市开展,同类型犯罪在小尺度跨城市影响因子分析方面的研究仍很欠缺。同时,同一犯罪类型在不同区域因不同研究人员选取的影响因子类型、因子粒度、因子数量及不同因子所采用的测度方式不同,得到的结果可能也会存在较大差异。为实现跨区域地理环境相似性测度,需要在前人大量研究成果基础上,对同类型犯罪的跨地域共性影响因子开展进一步研究、提取及验证。而且这些共性影响因子的选取既要考虑数据的可获取性,又要确保相关因子组合在跨地域环境均具有稳定的较强解释力。
(2)有效的人文地理环境相似性测度方法仍亟待深入研究。人文地理研究涉及的许多环境变量多为离散变量,为将地理相似性方法应用于人文地理特征的空间推测,需要在大量序数或基数等不易简化为参数的“变量”上测量其相似性。现有的离散变量相似性度量方法均较简单,对跨区域地理环境相似性的解释力仍有待考量。
(3)不同的地理环境因子具有不同的层次、级别、量纲,如何将其围绕目标变量进行相似性测度,并建立目标变量相似性与各地理环境因子、以及所有自然-人文综合地理环境配置的相似性之间的关联,将是具有挑战性的工作。

8 结论与展望

8.1 结论

本文通过对2018年以来国内外基于地理相似性和基于迁移学习2种不同方法开展的相关跨区域空间预测研究相关文献的系统梳理和分析,比对分析了2类方法的基本原理、技术流程、分析单元及辅助数据选择、相似性方法度量、常用模型及典型应用情况,主要结论如下。
(1)在研究文献方面,2018年以来,基于2类方法开展的跨区域空间预测研究方面的文献总量呈现逐年递增的态势,表明相关研究越来越受到关注与重视。
(2)在方法流程方面,基于地理相似性和基于迁移学习的方法在总体技术流程上基本相同,但仍存在差异。前者多在同一研究区内开展跨样本区空间预测,而后者则是在2个以上不同研究区间开展跨区域空间预测;前者通常采用地理环境数据进行相似性度量,而后者则分为不使用辅助数据和使用辅助数据两种方法;前者方法简单且对样本量需求较少,后者在模型构建和训练时需要源域有大量样本数据支持,且通常要求目标域有少量数据用于模型优化;前者的精度评价往往仅针对本身,后者则需和多个现有成熟模型进行对比。
(3)在空间分析单元选择方面,基于地理相似性的方法在不同应用中存在差异性,代表性的土壤推测制图常使用10~90 m较小的格网单元,而生物分布预测与负样本生成等研究则多使用较大的公里格网或经纬度格网;迁移学习方法多采用较大的公里格网。
(4)在表征区域相似性的辅助数据选择方面,因研究内容的不同,基于地理相似性的研究多使用地形、气候、生物因子等地理环境数据;而基于迁移学习的研究多使用建成环境、交通出行特征、气象等城市环境相关数据。
(5)在相似性度量方法方面,基于地理相似性的方法常区分离散变量和连续变量,先采用自定义相似性度量方法得到单一辅助数据的相似性值,然后再通过加权、线性回归等方法计算综合相似度;迁移学习方法常采用相关系数、距离函数作为区域相似性匹配的度量方法或将区域匹配模型融入迁移模型中用于参数优化。
(6)在预测方法与模型方面,基于地理相似性的空间预测方法主要涉及地理相似性度量和空间预测两方面,空间预测模型包括自定义模型和联合机器学习的模型;迁移学习方法方面,目前已发展了用于人群流量预测的RegionTrans[17]、ST-DAAN[78]和交通预测的ST-GFSL[54]、CrossTReS[67]、CARPG[50]等一些认可度较高的模型,同时在犯罪预测方面也开展了初步尝试。
(7)在方法局限性方面,基于地理相似性的空间预测应用目前仍局限在自然地理相关领域,应用面比较窄,更多社会经济、人文因子的相似性表征与度量方法尚待深入研究;迁移学习方法在空间分析单元、研究对象、辅助数据选择等方面仍存在一定的局限性。
总之,2类方法对比分析结果表明,二者对地理环境或城市环境进行相似性度量的思想基本一致,在实际应用中相互支撑与验证:地理相似性为迁移学习中源域与目标域的相似区域匹配提供了理论基础;而迁移学习,尤其是其在犯罪预测领域的成功应用,为地理相似性理论在人文地理领域应用的可行性进行了有效验证。但两类方法目前在适用范围、相似性表征与度量、相关参数选择等方面存在差异,如何相互取长补短或有效融合应用是未来值得努力的方向。

8.2 展望

地理相似性规律的提出,以及迁移学习技术的不断发展完善,为开展跨区域空间预测奠定了理论基础并提供了新思路。未来可以进一步考虑加强以下相关研究,将上述有关跨区域知识迁移的方法引入更多应用领域,以促进少样本或无样本地区空间预测技术的研究与应用。
(1)加强基于地理相似性的空间预测方法在人文地理学领域的理论方法研究。开展基于地理相似性在人文地理空间预测方面的理论、因子表征与测度、空间推测方法等方面研究,以补充该理论在人文地理学领域的应用案例。首先,需根据不同的人文地理研究问题,筛选适合用于相似性测度的共性影响因子,提升因子选择的可泛化性、可解释性;其次,设计更适用于人文地理研究的相似性度量方法,合理解决离散数据的使用和度量问题;最后,研究设计基于地理相似性的合理空间预测模型,以确保达到较高的预测精度。
(2)探索地理相似性与迁移学习方法的融合,提高跨区域知识迁移的精度。应充分发挥两者在关键影响因子选择、相似性高精度表征和小样本学习等方面各自优势,针对不同应用领域,研究构建出更为有效的跨区域知识迁移预测模型。一方面,基于地理相似性的相似性度量方法能够结合地理学专业知识,选择更加合理的辅助数据进行相似性测度,匹配高相似度区域,弥补目前迁移学习方法在此方面的不足;另一方面,迁移学习模型作为目前解决小样本预测的重要技术,可补充基于地理相似性的空间预测方法在模型训练、多维数据特征捕捉能力等方面的不足。
(3)以犯罪空间预测为突破点,积极开展跨区域知识迁移方法在人文地理领域的应用探索。针对国内研究机构开展犯罪预测所面临的大规模犯罪样本数据难以获取的问题,可探索借助地理相似性规律或迁移学习方法,将从可获得的国内部分地区的高质量犯罪数据及丰富的建成环境、社会经济数据中学习的知识,迁移至更多城市区域,以提升这些数据利用率和可使用范围。此外,还可开展国外公开犯罪数据集在我国的可迁移性及其技术可行性的研究探索,并尝试建立跨国知识迁移的技术方法体系等。
[1]
Bui D T, Tuan T A, Klempe H, et al. Spatial prediction models for shallow landslide hazards: A comparative assessment of the efficacy of support vector machines, artificial neural networks, kernel logistic regression, and logistic model tree[J]. Landslides, 2016, 13(2):361-378. DOI:10.1007/s10346-015-0557-6

[2]
Hong H Y, Pradhan B, Xu C, et al. Spatial prediction of landslide hazard at the Yihuang area (China) using two-class kernel logistic regression, alternating decision tree and support vector machines[J]. Catena, 2015, 133:266-281. DOI:10.1016/j.catena.2015.05.019

[3]
罗袆沅, 蒋亚楠, 许强, 等. 基于深度学习的滑坡位移时空预测[J]. 测绘学报, 2022, 51(10):2160-2170.

DOI

[Luo H Y, Jiang Y N, Xu Q, et al. A spatio-temporal network for landslide displacement prediction based on deep learning[J]. Acta Geodaetica et Cartographica Sinica, 2022, 51(10):2160-2170.] DOI:10.11947/j.AGCS.2022.20220297

[4]
Chang F J, Chang L C, Huang C W, et al. Prediction of monthly regional groundwater levels through hybrid soft-computing techniques[J]. Journal of Hydrology, 2016, 541:965-976. DOI:10.1016/j.jhydrol.2016.08.006

[5]
Austin M P. Spatial prediction of species distribution: An interface between ecological theory and statistical modelling[J]. Ecological Modelling, 2002, 157(2/3):101-118. DOI:10.1016/S0304-3800(02)00205-3

[6]
杜艳玲, 马玉玲, 汪金涛, 等. 基于ConvLSTM-CNN预测太平洋长鳍金枪鱼时空分布趋势[J]. 海洋通报, 2024(2):174-187.

[Du Y L, Ma Y L, Wang J T, et al. Prediction of spatial-temporal distribution trend of Pacific albacore tuna based on ConvLSTM-CNN[J]. Marine Science Bulletin, 2024(2):174-187.] DOI:10.11840/j.issn.1001-6392.2024.02.003

[7]
Zhao S N, Liu X H, Cheng D M, et al. Temporal-spatial variation and partitioning prediction of antibiotics in surface water and sediments from the intertidal zones of the yellow river delta, China[J]. Science of the Total Environment, 2016, 569:1350-1358. DOI:10.1016/j.scitotenv.2016.06.216

[8]
王军, 严有龙, 王金满, 等. 闽江流域生境质量时空演变特征与预测研究[J]. 生态学报, 2021, 41(14):5837-5848.

[Yan Y L, Wang J M, et al. Temporal-spatial variation characteristics and prediction of habitatquality in Min River Basin[J]. Acta Ecologica Sinica, 2021, 41(14):5837-5848.] DOI:10.5846/stxb202010142618

[9]
贺日兴, 陆宇梅, 姜超, 等. 近10年来犯罪时空预测国内外研究与实践进展[J]. 地球信息科学学报, 2023, 25(4):866-882.

DOI

[Lu Y M, Jiang C, et al. Progress in research and practice of spatial-temporal crime prediction over the past decade[J]. Journal of Geo-information Science, 2023, 25(4):866-882.] DOI:10.12082/dqxxkx.2023.220808

[10]
贺日兴, 唐宗棣, 姜超, 等. 顾及道路权重的图卷积犯罪时空预测模型[J]. 地球信息科学学报, 2023, 25(10):1986-1999.

DOI

[He R X, Tang Z D, Jiang C, et al. A graph convolution-based spatio-temporal crime prediction model considering road weights[J]. Journal of Geo-information Science, 2023, 25(10):1986-1999.] DOI:10.12082/dqxxkx.2023.230299

[11]
Kang H W, Kang H B. Prediction of crime occurrence from multi-modal data using deep learning[J]. PLoS one, 2017, 12(4). DOI:10.1371/journal.pone.0176244

[12]
孙明. 基于跨城市数据的交通流量预测研究[D]. 南京: 南京航空航天大学, 2021.

[Sun M. Prediction and analysis technology of traffic flow prediction based on cross-city data[D]. Nanjing: Nanjing University of Aeronautics and Astronautics, 2021.] DOI:10.27239/d.cnki.gnhhu.2021.001757

[13]
He R X, Xu Y Q, Jiang S H. Applications of GIS in public security agencies in China[J]. Asian Journal of Criminology, 2022, 17(2):213-235. DOI:10.1007/s11417-021-09360-5

[14]
祁小梅. 奥苏贝尔认知结构与迁移理论及教学[J]. 黑龙江高教研究, 2004, 22(5):99-100.

[Qi X M. Ausubel's cognitive structure and transfer theory and teaching[J]. Heilongjiang Researches on Higher Education, 2004, 22(5):99-100.] DOI:10.3969/j.issn.1003-2614.2004.05.039

[15]
Pan S J, Yang Q. A survey on transfer learning[J]. IEEE Transactions on Knowledge and Data Engineering, 2010, 22(10):1345-1359. DOI:10.1109/TKDE.2009.191

[16]
郭涛. 基于迁移学习的跨城市人流预测[D]. 长春: 吉林大学, 2022.

[Guo T. Cross-city crowd flow prediction based on transfer learning[D]. Changchun: Jilin University, 2022.] DOI:10.27162/d.cnki.gjlin.2022.006007

[17]
Wang L, Geng X, Ma X, et al. Crowd flow prediction by deep spatio-temporal transfer learning[J]. ArXiv, 2018,abs/1802.00386.

[18]
Liu Z Y, Zheng G J, Yu Y W. Cross-city few-shot traffic forecasting via traffic pattern bank[C]// Proceedings of the 32nd ACM International Conference on Information and Knowledge Management.ACM, 2023. DOI:10.1145/3583780.3614829

[19]
Wang B, Yan Z, Lu J, et al. Road traffic flow prediction using deep transfer learning[C]// Data Science and Knowledge Engineering for Sensing Decision Support. World Scietific 2018:331-338. DOI:10.1142/9789813273238_0044

[20]
缪浩. 基于深度学习的城市交通流预测[D]. 南京: 南京航空航天大学, 2021.

[Miu H. Deep learning based urban traffic prediction[D]. Nanjing: Nanjing University of Aeronautics and Astronautics, 2021.] DOI:10.27239/d.cnki.gnhhu.2021.001897

[21]
Butt U M, Letchmunan S, Hassan F H, et al. Leveraging transfer learning with deep learning for crime prediction[J]. Plos One, 2024, 19(4):e296486. DOI:10.1371/journal.pone.0296486

[22]
Zhou B B, Chen L B, Zhao S, et al. Unsupervised domain adaptation for crime risk prediction across cities[J]. IEEE Transactions on Computational Social Systems, 2023, 10(6):3217-3227. DOI:10.1109/TCSS.2022.3207987

[23]
Bappee F K, Soares A, Petry L M, et al. Examining the impact of cross-domain learning on crime prediction[J]. Journal of Big Data, 2021, 8(1):96. DOI:10.1186/s40537-021-00489-9

PMID

[24]
李晶晶, 孟利超, 张可, 等. 领域自适应研究综述[J]. 计算机工程, 2021, 47(6):1-13.

DOI

[Meng L C, Zhang K, et al. Review of studies on domain adaptation[J]. Computer Engineering, 2021, 47(6):1-13.] DOI:10.19678/j.issn.1000-3428.0060659

[25]
Zhu A X, Lu G N, Liu J, et al. Spatial prediction based on third law of geography[J]. Annals of GIS, 2018, 24(4):225-240. DOI:10.1080/19475683.2018.1534890

[26]
Fan X, Fan N, Qin C, et al. Large-area soil mapping based on environmental similarity with adaptive consideration of spatial distance to samples[J]. Geoderma, 2023, 439:116683. DOI:10.1016/j.geoderma.2023.116683

[27]
Fan N, Zhao F, Zhu L, et al. Digital soil mapping with adaptive consideration of the applicability of environmental covariates over large areas[J]. International Journal of Applied Earth Observation and Geoinformation, 2022, 113:102986. DOI:10.1016/j.jag.2022.102986

[28]
Li Y, Zhang N, Li R K, et al. Soil mapping based on assessment of environmental similarity and selection of calculating samples[J]. Catena, 2020, 188:104379. DOI:10.1016/j.catena.2019.104379

[29]
Wang D S, Zhu A X. Soil mapping based on the integration of the similarity-based approach and random forests[J]. Land, 2020, 9(6):174. DOI:10.3390/land9060174

[30]
肖巍峰, 左绿荇, 杨文涛, 等. 基于地理环境相似度的长江经济带入侵物种虚拟负样本生成方法[J]. 生物多样性, 2023, 31(1):256-267.

[Zuo L X, Yang W T, et al. Generating pseudo-absence samples of invasive species based on the similarity of geographical environment in the Yangtze River Economic Belt[J]. Biodiversity Science, 2023, 31(1):256-267.] DOI:10.17520/biods.2022094

[31]
杨文涛, 吕春彤, 陈浩. 地理环境条件约束的入侵物种虚拟负样本生成方法[J]. 干旱区资源与环境, 2020, 34(9):179-187.

[Yang W T, Lv C T, Chen H. Generating pseudo-absence samples of invasive species under the constraint of geographical environment[J]. Journal of Arid Land Resources and Environment, 2020, 34(9):179-187.] DOI:10.13448/j.cnki.jalre.2020.257

[32]
刘国栋, 秦胜伍, 孟凡奇, 等. 基于地理信息相似度的负样本采样策略在泥石流易发性评价中的应用[J]. 工程地质学报, 2023, 31(2):526-537.

[Liu G D, Qin S W, Meng F Q, et al. Application of Geographic information similarity based absence sampling Method to debris flow susceptibility[J]. Journal of Engineering Geology, 2023, 31(2):526-537.] DOI:10.13544/j.cnki.jeg.2022-0317

[33]
Zhu A, Miao Y, Liu J, et al. A similarity-based approach to sampling absence data for landslide susceptibility mapping using data-driven methods[J]. Catena, 2019, 183:104188. DOI:10.1016/j.catena.2019.104188

[34]
李文辉. 基于地理相似性的森林火灾空间预测非火点数据采样方法[D]. 昆明: 云南师范大学, 2023.

[Li W H. Geographical similarity-based sampling method of non-fire point data for spatial prediction of forest fires[D]. Kunming: Yunnan Normal University, 2023.] DOI:10.27459/d.cnki.gynfc.2023.001292

[35]
Liberati A, Altman D G, Tetzlaff J, et al. The prisma statement for reporting systematic reviews and meta-analyses of studies that evaluate health care interventions: explanation and elaboration[J]. Journal of Clinical Epidemiology, 2009, 62(10):e1-e34. DOI:10.1016/j.jclinepi.2009.06.006

[36]
Du H W, Zhu A X, Wang Y. Spatial prediction of flea index of transmitting plague based on environmental similarity[J]. Annals of GIS, 2020, 26(3):227-236. DOI:10.1080/19475683.2020.1788639

[37]
朱阿兴. 简论地理学三定律[J]. 地理教育, 2023(1):3-7.

[Zhu A X. On the three laws of geography[J]. Education of Geography, 2023(1):3-7.] DOI:10.12082/dqxxkx.2020.200069

[38]
朱阿兴, 闾国年, 周成虎, 等. 地理相似性:地理学的第三定律?[J]. 地球信息科学学报, 2020, 22(4):673-679.

DOI

[Zhu A X, Lv G N, Zhou C H, et al. Geographic Similarity: Third Law of Geography?[J]. Journal of Geo-Information Science, 2020, 22(4):673-679.] DOI:10.12082/dqxxkx.2020.200069

[39]
Zhu A X, Turner M. How is the third law of geography different?[J]. Annals of GIS, 2022, 28(1):57-67. DOI:10.1080/19475683.2022.2026467

[40]
Zhuang F Z, Qi Z Y, Duan K Y, et al. A comprehensive survey on transfer learning[J]. Proceedings of the IEEE, 2021, 109(1):43-76. DOI:10.1109/JPROC.2020.3004555

[41]
Qin C Z, An Y M, Liang P, et al. Soil property mapping by combining spatial distance information into the soil land inference model (solim)[J]. Pedosphere, 2021, 31(4):638-644. DOI:10.1016/S1002-0160(20)60016-9

[42]
廖秀英, 王波, 余昕, 等. 基于地理最优相似性的土壤重金属镉含量空间预测[J]. 中南大学学报(自然科学版), 2024, 55(6):2143-2152.

[Liao X Y, Wang B, Yu X, et al. Spatial prediction of soil heavy metal cadmium content based on geographically optimal similarity[J]. Journal of Central South University(Science and Technology), 2024, 55(6):2143-2152.] DOI:10.11817/j.issn.1672-7207.2024.06.008

[43]
洪浩源, 王德生, 朱阿兴. 面向机器学习型区域滑坡易发性评价的训练样本采样方法[J]. 地理学报, 2024, 79(7):1718-1736.

DOI

[Hong H Y, Wang D S, Zhu A X. A new training data sampling method for machine learning-based landslide susceptibility mapping[J]. Acta Geographica Snica, 2024, 79(7):1718-1736.] DOI:10.11821/dlxb202407006.

[44]
王蕾. 基于环境相似性的小流域土壤有机碳含量制图方法探索[D]. 西宁: 青海师范大学, 2021.

[Wang L. Exploration of Mapping Method of Soil Organic Carbon Content in Small Watershed Based on Environmental Similarity[D]. Xining: Qinghai Normal University, 2021.] DOI:10.27778/d.cnki.gqhzy.2021.000118

[45]
Li Y, An Y, Zhou Z, et al. Simulation of urban expansion using geographical similarity transition rules and neighbourhood sizes[J]. Journal of Geographical Sciences, 2024, 34(7):1394-1414. DOI:10.1007/s11442-024-2253-8

[46]
Song Y. Geographically optimal similarity[J]. Mathematical Geosciences, 2023, 55(3):295-320. DOI:10.1007/s110 04-022-10036-8

[47]
Wang Y D, Kong Y F, Chen H, et al. Improving daily precipitation estimates for the qinghai-tibetan plateau based on environmental similarity[J]. International Journal of Climatology, 2020, 40(12):5368-5388. DOI:10.1002/joc.6523

[48]
Sheng M L, Zhang W X, Nie J, et al. Predicting isoscapes based on an environmental similarity model for the geographical origin of chinese rice[J]. Food Chemistry, 2022, 397:133744. DOI:10.1016/j.foodchem.2022.133744

[49]
盛美玲. 基于环境相似性的作物生长模型参数空间推测方法研究[D]. 南京: 南京师范大学, 2019.

[Sheng M L. Spatial prediction of crop growth model parameters based on environmental similarity[D]. Nanjing: Nanjing Normal University, 2019.] DOI:10.27245/d.cnki.gnjsu.2019.002314

[50]
Sheng M L, Zhu A X, Ma T W, et al. Estimation of spring maize planting dates in China using the environmental similarity method[J]. Agronomy, 2023, 14(1):97. DOI:10.3390/agronomy14010097

[51]
Yan H, Wang H, Zhang D, et al. Identifying regional driving risks via transductive cross-city transfer learning under negative transfer[C]// Proceedings of the 32nd ACM International Conference on Information and Knowledge Management.ACM, 2023. DOI:10.1145/3583780.3614924

[52]
刘兆洋. 无桩共享单车跨城市分布预测及热点检测研究[D]. 上海: 上海交通大学, 2019.

[Liu Z Y. Dockless Shared Bike Distribution Inference and Hotspots Detection in New Cities[D]. Shanghai: Shanghai Jiao Tong University, 2019.] DOI:10.27307/d.cnki.gsjtu.2019.002032

[53]
胡静. 基于区域时空相似性的城市人群流量迁移学习研究[D]. 北京: 北京建筑大学, 2023.

[Hu J. Research on urban crowd flow transfer learning based on regional spatio-temporal similarity[D]. Beijing: Beijing University of Civil Engineering and Architecture, 2023.] DOI:10.26943/d.cnki.gbjzc.2023.000269

[54]
Yang G, Zhang Y Q, Hang J Q, et al. CARPG: Cross-city knowledge transfer for traffic accident prediction via attentive region-level parameter generation[C]// Proceedings of the 32nd ACM International Conference on Information and Knowledge Management. ACM, 2023. DOI: 10.1145/3583780.3614802

[55]
Mallick T, Balaprakash P, Rask E, et al. Transfer learning with graph neural networks for short-term highway traffic forecasting[C]// 2020 25th International Conference on Pattern Recognition (ICPR). IEEE, 2021:10367-10374. DOI:10.1109/ICPR48806.2021.9413270

[56]
Chen K H, Han J D, Feng S Y, et al. Cross-city traffic prediction via semantic-fused hierarchical graph transfer learning[J]. Journal of Latex Class Files, 2023. DOI:10.48550/arXiv.2302.11774

[57]
Zhang S Y, Li T, Hui S D, et al. Deep transfer learning for city-scale cellular traffic generation through urban knowledge graph[C]// Proceedings of the 29th ACM SIGKDD Conference on Knowledge Discovery and Data Mining. ACM, 2023. DOI: 10.1145/3580305.3599801

[58]
Lu B, Gan X Y, Zhang W N, et al. Spatio-temporal graph few-shot learning with cross-city knowledge transfer[C]// Proceedings of the 28th ACM SIGKDD Conference on Knowledge Discovery and Data Mining. ACM, 2022. DOI: 10.1145/3534678.3539281

[59]
Cope R C, Ross J V, Wittmann T A, et al. Predicting the risk of biological invasions using environmental similarity and transport network connectedness[J]. Risk Analysis, 2019, 39(1):35-53. DOI:10.1111/risa.12870

PMID

[60]
Zhao F H, Huang J Y, Zhu A X. Spatial prediction of groundwater level change based on the third law of geography[J]. International Journal of Geographical Information Science, 2023, 37(10):2129-2149. DOI:10.1080/1365 8816.2023.2248215.

[61]
Chen Y, Gu J J, Zhuang F Z, et al. Exploiting hierarchical correlations for cross-city cross-mode traffic flow prediction[C]// 2022 IEEE International Conference on Data Mining (ICDM). IEEE, 2022:891-896. DOI:10.1109/ICDM54844.2022.00103.

[62]
Mo J Q, Gong Z G. Cross-city multi-granular adaptive transfer learning for traffic flow prediction[J]. IEEE Transactions on Knowledge and Data Engineering, 2023, 35(11):11246-11258. DOI:10.1109/TKDE.2022.3232185

[63]
Ouyang X C, Yang Y, Zhang Y L, et al. Domain adversarial graph neural network with cross-city graph structure learning for traffic prediction[J]. Knowledge-Based Systems, 2023, 278:110885. DOI:10.1016/j.knosys.2023.110885

[64]
Tian C J, Zhu X N, Hu Z, et al. A transfer approach with attention reptile method and long-term generation mechanism for few-shot traffic prediction[J]. Neurocomputing, 2021, 452:15-27. DOI:10.1016/j.neucom.2021.03.068

[65]
Wu Q, He K W, Chen X, et al. Deep transfer learning across cities for mobile traffic prediction[J]. IEEE/ACM Transactions on Networking, 2022, 30(3):1255-1267. DOI:10.1109/TNET.2021.3136707

[66]
Zhang Y X, Li Y H, Zhou X, et al. Mest-GAN: Cross-city urban traffic estimation with meta spatial-temporal generative adversarial networks[C]// 2022 IEEE International Conference on Data Mining (ICDM). IEEE. 2022:733-742. DOI:10.1109/ICDM54844.2022.00084

[67]
Li J Y, Xie N K, Zhang K H, et al. Network-scale traffic prediction via knowledge transfer and regional MFD analysis[J]. Transportation Research Part C: Emerging Technologies, 2022, 141:103719. DOI:10.1016/j.trc.2022.103719

[68]
Liu Z, Zheng G, Yu Y. Multi-scale traffic pattern bank for cross-city few-shot traffic forecasting[J]. Jounal of Latex Class Files, 2024. DOI:10.48550/arXiv.2402.00397

[69]
Yin X Y, Li F F, Shen Y M, et al. Nodetrans: a graph transfer learning approach for traffic prediction[EB/OL]. 2022:2207.01301. https://arxiv.org/abs/2207.01301v1.

[70]
Huang Y J, Song X Z, Zhu Y S, et al. Traffic prediction with transfer learning: A mutual information-based approach[J]. IEEE Transactions on Intelligent Transportation Systems, 2023, 24(8):8236-8252. DOI:10.1109/TITS.2023.3266398

[71]
Jin Y L, Chen K, Yang Q. Selective cross-city transfer learning for traffic prediction via source city region re-weighting[C]// Proceedings of the 28th ACM SIGKDD Conference on Knowledge Discovery and Data Mining. ACM, 2022. DOI:10.1145/3534678.3539250

[72]
Qi Y X, Wu J, Bashir A K, et al. Privacy-preserving cross-area traffic forecasting in ITS: a transferable spatial-temporal graph neural network approach[J]. IEEE Transactions on Intelligent Transportation Systems, 2023, 24(12):15499-15512. DOI:10.1109/TITS.2022.3215326

[73]
Zhang Y X, Li Y H, Zhou X, et al. STRANS-GAN spatially-transferable generative adversarial networks for urban traffic estimation[C]// 2022 IEEE International Conference on Data Mining (ICDM). IEEE, 2022:743-752. DOI:10.1109/ICDM54844.2022.00085

[74]
Zou X X, Chung E. Traffic prediction via clustering and deep transfer learning with limited data[J]. Computer-Aided Civil and Infrastructure Engineering, 2024, 39(17):2683-2700. DOI:10.1111/mice.13207

[75]
Huang Y, Song X, Zhang S, et al. Transfer learning in traffic prediction with graph neural networks[C]// 2021 IEEE International Intelligent Transportation Systems Conference (ITSC). IEEE, 2021:3732-3737. DOI:10.1109/ITSC48978.2021.9564890

[76]
Yang N K, Lu Q L, Lyu C, et al. Transfer learning for transportation demand resilience pattern prediction using floating car data[J]. Transportation Research Record: Journal of the Transportation Research Board, 2024:355344399. DOI:10.1177/03611981241245681

[77]
Yao Z X, Xia S C, Li Y, et al. Transfer learning with spatial-temporal graph convolutional network for traffic prediction[J]. IEEE Transactions on Intelligent Transportation Systems, 2023, 24(8):8592-8605. DOI:10.1109/TITS.2023.3250424

[78]
王欣, 王志飞, 王煜. 基于迁移学习的轨道交通特殊OD客流预测研究[J]. 铁道运输与经济, 2024, 46(3):182-188.

[Wang X, Wang Z F, Wang Y. OD rail transit passenger flow forecast for special sections based on transfer learning[J]. Railway Transport and Economy, 2024, 46(3):182-188.] DOI:10.16668/j.cnki.issn.1003-1421.2024.03.23

[79]
任亚捷. 基于迁移学习的电动汽车充电站需求预测研究[D]. 北京: 北京邮电大学, 2021.

[Ren Y J. Research on demand prediction for electric vehicle charging stations based on transfer learning[D]. Beijing: Beijing University of Posts and Telecommunications, 2021.] DOI:10.26969/d.cnki.gbydu.2021.002066

[80]
Wang L Y, Geng X, Ma X J, et al. Cross-city transfer learning for deep spatio-temporal prediction[C]// International Joint Conference on Artificial Intelligence (IJCAI-19), 2018.

[81]
Fang Z, Wu D, Pan L, et al. When transfer learning meets cross-city urban flow prediction: spatio-temporal adaptation matters[C]// International Joint Conference on Artificial Intelligence (IJCAI-22), 2022. DOI:10.24963/ijcai.20 22/282

[82]
Wang S Z, Miao H, Li J YW, et al. Spatio-temporal knowledge transfer for urban crowd flow prediction via deep attentive adaptation networks[J]. IEEE Transactions on Intelligent Transportation Systems, 2022, 23(5):4695-4705. DOI:10.1109/TITS.2021.3055207

[83]
刘宝生, 闫莉萍, 周东华. 几种经典相似性度量的比较研究[J]. 计算机应用研究, 2006, 23(11):1-3.

[Liu B S, Yan L P, Zhou D H. Comparison of Some Classical Similarity Measures[J]. Application Research of Computers, 2006, 23(11):1-3.] DOI:10.3969/j.issn.1001-3695.2006.11.001

[84]
郭澎涛, 朱阿兴, 李茂芬, 等. 基于环境与光谱相似性的橡胶树叶片磷含量局部估测模型[J]. 农业工程学报, 2022, 38(3):204-211.

[Zhu A X, Li M F, et al. Local model based on environmental similarity and spectral similarity for estimating leaf phosphorus concentration of rubber trees[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2022, 38(3):204-211.] DOI:10.11975/j.issn.1002-6819.2022.03.024

[85]
Zhu A X, Band L, Vertessy R, et al. Derivation of soil properties using a soil land inference model (SoLIM)[J]. Soil Science Society of America Journal, 1997, 61(2):523-533. DOI:10.2136/sssaj1997.03615995006100020022x

[86]
Zhu A X, Liu J, Du F, et al. Predictive soil mapping with limited sample data[J]. European Journal of Soil Science, 2015, 66(3):535-547. DOI:10.1111/ejss.12244

[87]
Tobler W R. A computer movie simulating urban growth in the detroit region[J]. Economic Geography, 1970, 46:234. DOI:10.2307/143141

[88]
Lin S F, Zhang Y Y, Liu X L, et al. Incorporating the third law of geography with spatial attention module-convolutional neural network-transformer for fine-grained non-stationary air quality predictive learning[J]. Mathematics, 2024, 12(10). DOI:10.3390/math12101457

文章导航

/