跨区域知识迁移的空间预测:两大类方法的对比分析
栾雨芃(2001— ),女,山东济南人,硕士生,主要研究方向为犯罪地理与犯罪分析。E-mail: pp20010811@126.com |
Copy editor: 蒋树芳
收稿日期: 2024-06-23
修回日期: 2024-09-07
网络出版日期: 2024-11-07
基金资助
国家重点研发计划项目(2022YFB3903602)
国家自然科学基金项目(42371251)
国家自然科学基金青年项目(42001159)
首都师范大学2024年度实验室开放基金项目(LIP2024S252)
Spatial Prediction Based on Cross-area Knowledge Transfer: Comparison of Two Methods
Received date: 2024-06-23
Revised date: 2024-09-07
Online published: 2024-11-07
Supported by
National Key Research and Development Program(2022YFB3903602)
National Natural Science Foundation of China(42371251)
Youth Fund of the National Natural Science Foundation of China(42001159)
Open Laboratory Fund of Capital Normal University in 2024(LIP2024S252)
跨区域知识迁移是在少样本地区开展空间预测的一种重要手段。目前基于迁移学习技术和基于地理学第三定律的跨区域空间预测分别是计算机领域和地学领域的主流方法。本文对2018年以来国内外基于以上两大类方法开展的相关跨区域空间预测研究进行了文献综述,主要工作包括: ① 对比分析了基于地理相似性和基于迁移学习进行空间预测的基本原理及二者的技术流程异同; ② 总结了2类方法在相似性表征指标及相似性度量方法方面的差异; ③ 梳理了2类不同预测方法在常用的辅助数据、空间分析单元、模型方法与评价指标选取方面的差异; ④ 探讨了2类跨区域知识迁移的空间预测方法面临的问题及挑战。研究表明,2类方法的技术思想基本一致,但在适用范围、相似性表征与度量、相关辅助变量及参数选择等方面均存在一定局限性。研究可为两类方法优化完善及有效融合、跨区域预测方法的创新、应用领域的扩展等提供有益参考。
栾雨芃 , 贺日兴 , 姜超 , 邓悦 , 朱孟真 , 王一童 , 唐宗棣 . 跨区域知识迁移的空间预测:两大类方法的对比分析[J]. 地球信息科学学报, 2024 , 26(11) : 2465 -2482 . DOI: 10.12082/dqxxkx.2024.240365
Due to the imbalanced regional development, data scarcity exists in some regions, which to some extent restricts the progress of spatial prediction research. The introduction of cross-area knowledge transfer offers a valuable method for mitigating the impact of data scarcity in areas with limited samples and for conducting spatial prediction. With technological advancements, spatial prediction methods based on transfer learning and the Third Law of Geography have become mainstream in the fields of computer science and geography. Transfer learning techniques leverage knowledge from a source domain with abundant data to solve related tasks in a target domain with limited data. Meanwhile, the proposal and application of the Third Law of Geography show that by comparing the similarity of geographical environmental variables between sampled regions and unsampled regions (rather than relying solely on traditional spatial distance or quantitative relationships), it is possible to predict target information in unsampled regions using a small amount of sample data. This provides a theoretical basis and methodological reference for selecting the source domain and target domain in cross-regional knowledge transfer. This paper conducts a literature review of cross-regional spatial prediction research based on these two major methods since 2018, focusing on the following key tasks: (1) Comparing and analyzing the basic principles of spatial prediction based on geographical similarity and transfer learning, and identifying differences in their technical procedures; (2) Summarizing the differences in similarity representation indicators and measurement methods between the two approaches; (3) Examining differences in commonly used auxiliary data, spatial analysis units, modeling methods, and evaluation indicators between the two prediction methods; (4) Discussing the challenges and limitations faced by these cross-regional knowledge transfer methods. The study shows that while the technical principles of both methods are basically consistent, they have specific limitations regarding their scope of application, similarity representation and measurement, relevant auxiliary variables, and parameter selection. The research offers useful insights for optimizing and improving these methods, integrating them effectively, innovating cross-regional prediction approaches, and expanding their application fields.
表1 文献检索中的中英文关键词组合Tab. 1 Combination of Chinese and English keywords in literature retrieval |
研究方法所属领域 | 英文关键词组合 | 中文关键词组合 |
---|---|---|
计算机领域 | "cross-city" "cross-domain" "cross-area"; | "跨区域"、"跨城市"; |
"knowledge transfer" "transfer learning"; | "知识迁移"、"迁移学习"; | |
"prediction" "forecast" | "预测" | |
地学领域 | "environmental similarity" "third law of geography" | "地理相似性"、"环境相似"、"地理学第三定律" |
表2 文献采用的空间分析单元情况统计及对比Tab. 2 Statistics of spatial analysis units adopted in the literature |
研究方法 | 空间分析单元 类型及大小 | 使用频率/% | 应用方向 |
---|---|---|---|
地理相 似性 | 10 m×10 m方形格网 | 15.0 | 土壤推测制图[29,41-42] |
30 m×30 m方形格网 | 25.0 | 缺失数据采样[33,43]、 土壤推测制图[28,44]、 城市变迁规律[45] | |
90 m×90 m方形格网 | 15.0 | 土壤推测制图[26-27,41] | |
1 km×1 km方形格网 | 15.0 | 生物分布预测[36]、 负样本生成[34]、 土壤推测制图[46] | |
8 km×8 km方形格网 | 5.0 | 降水量估算[47] | |
20 km×20 km方形 格网 | 10.0 | 负样本生成[30-31] | |
0.15°×0.15°格网 | 5.0 | 生物分布预测[48] | |
0.25°×0.25°格网 | 10.0 | 作物生长状况 推测[49-50] | |
迁移学习 | 500 m×500 m方形 格网 | 13.3 | 人群流量预测[16]、 交通预测[51] |
1 km×1 km方形格网 | 33.3 | 交通预测[12,52]、 人群流量预测[17,53] | |
2 km×2 km方形格网 | 6.7 | 交通预测[54] | |
3 km×3 km方形格网 | 6.7 | 犯罪预测[22] | |
社区 | 13.3 | 犯罪预测[21,23] | |
路网 | 26.7 | 交通预测[55⇓⇓-58] |
表3 文献中表征相似性的常用辅助数据使用情况Tab. 3 Commonly used auxiliary data for representing similarity in the literature |
研究 方法 | 应用方向 | 表征相似性的辅助数据 | ||||||
---|---|---|---|---|---|---|---|---|
地形 | 气候 | 地质因子 | 生物因子 | POI | 路网结构 | 其他 | ||
地理 相似性 | 土壤预测制图[26⇓⇓-29,41-42,44,46] | 海拔、 坡度、 坡向、 平面曲率、 剖面曲率、 地形湿度指数(TWI) …… | 温度、 降水量、 水分指数 …… | 母质类型 | 归一化植被指数(NDVI) | - | - | 土地利用类型、 土地覆盖类型、 LSDF数据集 |
负样本生成/缺失数据采样[30⇓⇓⇓-34,43] | 海拔/高程、 坡度、 坡向、 平面曲率、 剖面曲率 …… | 温度、 相对湿度、 降水量、 气压、 风速、 日照时数 | 岩土体类型、 断层密度、 水系密度 | 植被类型、 植被覆盖度、 归一化植被指数(NDVI) | - | 道路密度 | 人口数据、 土地利用类型、 土地覆盖类型、 …… | |
作物生长相关推测[49-50] | 高程、 坡度、 地形起伏度 | 温度、 降水量 | - | - | - | - | 经纬度 | |
生物分布预测/生物入侵预测[36,48,59-60] | 海拔 | 温度、 相对湿度、 降水量、 日照时数 …… | - | 化学元素同位素值 | - | - | 经纬度 | |
降水量估算[47] | - | 相对湿度、 降水量 | - | - | - | - | - | |
城市变迁规律[45] | 高程、 坡度 | - | 河流 | 归一化植被指数(NDVI) | - | 各级路网分布 | 人口、 国民生产总值、 土地利用类型 | |
迁移 学习 | 交通预测[12,18⇓ -20,51-52,54⇓⇓-57,61⇓⇓⇓⇓⇓⇓⇓⇓⇓⇓⇓⇓⇓⇓⇓⇓⇓ -79] | - | 温度、 天气、 降水量、 能见度 …… | - | - | 各类POI总数、 POI类别向量、 POI信息熵 | 路网结构、 路网类型 ·…… | 日历数据、 人口数据、 卫星灯光数据、 商业中心分布 …… |
人群流量预测[16-17,53,80⇓-82] | - | 温度、 湿度、 风速 | - | - | 各类POI总数 | 道路总长度、 公共交通站 点数量 | 建筑类型、 签到数据 …… | |
犯罪预测[21⇓-23] | - | 天气 | - | - | 各类POI总数 | - | 签到数据、 人口数据、 警察局分布、 出租车移动性 |
表4 单一辅助数据的相似性度量常用方法Tab. 4 Common methods for similarity measurement using a single auxiliary data |
研究 方法 | 数据 类型 | 相似性度量方法 | 公式 编号 | 应用方向 | 公式变量注释 |
---|---|---|---|---|---|
地理 相似性 | 连续 变量 | 核密度估计法 | 缺失数据采样[33]、 负样本生成[31-32,34] | ||
K均值聚类法 | 植被元素含量估测[84] | ||||
自定义方法: | (1) | 土壤推测制图[42⇓-44]、 城市变迁规律[45] | Ev(ev,ij, ev,k)表示ev,ij和ev,k两点间第v个环境协变量的相似性;ev,ij和ev,k分别表示第v个环境协变量在(ij)点和样本点k处的值;SDv为研究区第v个环境协变量的标准差;SDv to ek为未访问位置点(ij)的第v个环境协变量值与k个样本点的环境协变量值的均值偏差的平方根 | ||
离散 变量 | 概率密度函数 | 缺失数据采样[33]、 负样本生成[31] | |||
频率比法 | 负样本生成[32,34] | ||||
自定义方法: | (2) | 土壤推测制图[42⇓-44] | Ev(ev,ij, ev,k)表示ev,ij和ev,k两点间第v个环境协变量的相似性;ev,ij和ev,k分别表示第v个环境协变量在(ij)点和样本点k处的值。 | ||
迁移 学习 | 连续 变量 | 最大均值差异算法(MMD) | 公共设施分布预测[52] | ||
KL散度 | 公共设施分布预测[52]、 犯罪预测[23] | ||||
Jaccard相关系数 | 公共设施分布预测[52] | ||||
Pearson相关系数 | 人群流量预测[16,53]、 交通预测[12]、 犯罪预测[22] | ||||
余弦相似度 | 交通预测[51,68,71] |
表5 不同应用方向基于迁移学习的跨区域空间预测代表性模型Tab. 5 Representative models of cross-area spatial prediction based on transfer learning in different application directions |
应用 方向 | 模型/框架名称 | 研究区 | 迁移 方向 | 数据集 | 评价指标 | 预测精度 | ||
---|---|---|---|---|---|---|---|---|
目标数据 | 辅助数据 | |||||||
人群流量预测 | 跨城市深度时空迁移学习方法 RegionTrans[17] | A-Match | 华盛顿(A) 芝加哥(B) 20×20 km 中心城区 | A→B | 自行车流量 | 签到数据 | RMSE=0.576 | 相较最优基线模型最大减少了10.7%的预测误差 |
S-Match | 无 | RMSE=0.594 | ||||||
融合注意力机制的时空深度域适应网络模型ST-DAAN[82] | 成都(A) 北京(B) 纽约(C) 芝加哥(D) | A→B | 出租车上下车点位 | 节假日、 天气特征 | 归一化后 RMSE=0.060 | 相较RegionTrans模型最大减少了35.8%的预测误差 | ||
D→C | 自行车起点终点 | 归一化后 RMSE=0.021 | ||||||
交通 预测 | 时空图少样本学习框架 ST-GFSL[58] | 洛杉矶(A) 成都(B) 深圳(C) 旧金山湾区(D) | A+B+C→D | 高速公路 交通指数 | 无 | RMSE=1.865 | 相较最优基线模型最大减少了3.4%的预测误差 | |
选择性跨城市迁移学习框架CrossTReS[71] | 华盛顿(A) 芝加哥(B) 纽约(C) | B→A | 出租车上下车点位 | 道路数据、 POI数据 | RMSE=0.867 | 相较最优基线模型最大减少了8%的预测误差 | ||
C→A | RMSE=2.177 | |||||||
B→A | 自行车起点终点 | RMSE=2.211 | ||||||
C→A | RMSE=3.880 | |||||||
基于区域参数生成的交通事故预测跨城市知识迁移模型CARPG[54] | 芝加哥(A) 纽约(B) 纳什维尔(C) | B→C | 交通事故 | 出租车数据、 天气数据、 日历数据、 POI数据 | RMSE=9.010 | 相较最优基线模型最大减少了11.97%的预测误差 | ||
B→C | RMSE=17.220 | |||||||
犯罪 预测 | 梯度提升算法 Gradient Boosting[23] | 哈利法克斯(A) 多伦多(B) 温哥华(C) | B+C→A | 犯罪数据 | 人口普查范围数据、 人口数据、 路灯数据、 POI数据、 签到数据等 | AUC=70.520 | 平均提升了4.0%的AUC分数 | |
无监督领域自适应模型 UDAC[22] | 纽约(A) 芝加哥(B) 洛杉矶(C) | A→B | 犯罪数据 | 气象数据、 POI数据、 警察局分布、 出租车移动性 | RMSE=0.618 | 优于所有基线模型 | ||
B→A | RMSE=0.652 | |||||||
A→C | RMSE=0.626 | |||||||
C→A | RMSE=0.635 | |||||||
B→C | RMSE=0.813 | |||||||
C→B | RMSE=0.809 |
表6 精选文献中的常用精度评价指标Tab. 6 Common accuracy evaluation indicators in selected literature |
研究方法 | 精度评价指标 | 文献数/篇 | 使用频率/% |
---|---|---|---|
地理相似性 | RMSE | 12 | 40.0 |
MAE | 11 | 36.0 | |
R2 | 5 | 16.0 | |
迁移学习 | RMSE | 34 | 73.9 |
MAE | 27 | 58.7 | |
MAPE | 17 | 37.0 | |
MSE | 3 | 6.5 |
[1] |
|
[2] |
|
[3] |
罗袆沅, 蒋亚楠, 许强, 等. 基于深度学习的滑坡位移时空预测[J]. 测绘学报, 2022, 51(10):2160-2170.
[
|
[4] |
|
[5] |
|
[6] |
杜艳玲, 马玉玲, 汪金涛, 等. 基于ConvLSTM-CNN预测太平洋长鳍金枪鱼时空分布趋势[J]. 海洋通报, 2024(2):174-187.
[
|
[7] |
|
[8] |
王军, 严有龙, 王金满, 等. 闽江流域生境质量时空演变特征与预测研究[J]. 生态学报, 2021, 41(14):5837-5848.
[
|
[9] |
贺日兴, 陆宇梅, 姜超, 等. 近10年来犯罪时空预测国内外研究与实践进展[J]. 地球信息科学学报, 2023, 25(4):866-882.
[
|
[10] |
贺日兴, 唐宗棣, 姜超, 等. 顾及道路权重的图卷积犯罪时空预测模型[J]. 地球信息科学学报, 2023, 25(10):1986-1999.
[
|
[11] |
|
[12] |
孙明. 基于跨城市数据的交通流量预测研究[D]. 南京: 南京航空航天大学, 2021.
[
|
[13] |
|
[14] |
祁小梅. 奥苏贝尔认知结构与迁移理论及教学[J]. 黑龙江高教研究, 2004, 22(5):99-100.
[
|
[15] |
|
[16] |
郭涛. 基于迁移学习的跨城市人流预测[D]. 长春: 吉林大学, 2022.
[
|
[17] |
|
[18] |
|
[19] |
|
[20] |
缪浩. 基于深度学习的城市交通流预测[D]. 南京: 南京航空航天大学, 2021.
[
|
[21] |
|
[22] |
|
[23] |
|
[24] |
李晶晶, 孟利超, 张可, 等. 领域自适应研究综述[J]. 计算机工程, 2021, 47(6):1-13.
[
|
[25] |
|
[26] |
|
[27] |
|
[28] |
|
[29] |
|
[30] |
肖巍峰, 左绿荇, 杨文涛, 等. 基于地理环境相似度的长江经济带入侵物种虚拟负样本生成方法[J]. 生物多样性, 2023, 31(1):256-267.
[
|
[31] |
杨文涛, 吕春彤, 陈浩. 地理环境条件约束的入侵物种虚拟负样本生成方法[J]. 干旱区资源与环境, 2020, 34(9):179-187.
[
|
[32] |
刘国栋, 秦胜伍, 孟凡奇, 等. 基于地理信息相似度的负样本采样策略在泥石流易发性评价中的应用[J]. 工程地质学报, 2023, 31(2):526-537.
[
|
[33] |
|
[34] |
李文辉. 基于地理相似性的森林火灾空间预测非火点数据采样方法[D]. 昆明: 云南师范大学, 2023.
[
|
[35] |
|
[36] |
|
[37] |
朱阿兴. 简论地理学三定律[J]. 地理教育, 2023(1):3-7.
[
|
[38] |
朱阿兴, 闾国年, 周成虎, 等. 地理相似性:地理学的第三定律?[J]. 地球信息科学学报, 2020, 22(4):673-679.
[
|
[39] |
|
[40] |
|
[41] |
|
[42] |
廖秀英, 王波, 余昕, 等. 基于地理最优相似性的土壤重金属镉含量空间预测[J]. 中南大学学报(自然科学版), 2024, 55(6):2143-2152.
[
|
[43] |
洪浩源, 王德生, 朱阿兴. 面向机器学习型区域滑坡易发性评价的训练样本采样方法[J]. 地理学报, 2024, 79(7):1718-1736.
[
|
[44] |
王蕾. 基于环境相似性的小流域土壤有机碳含量制图方法探索[D]. 西宁: 青海师范大学, 2021.
[
|
[45] |
|
[46] |
|
[47] |
|
[48] |
|
[49] |
盛美玲. 基于环境相似性的作物生长模型参数空间推测方法研究[D]. 南京: 南京师范大学, 2019.
[
|
[50] |
|
[51] |
|
[52] |
刘兆洋. 无桩共享单车跨城市分布预测及热点检测研究[D]. 上海: 上海交通大学, 2019.
[
|
[53] |
胡静. 基于区域时空相似性的城市人群流量迁移学习研究[D]. 北京: 北京建筑大学, 2023.
[
|
[54] |
|
[55] |
|
[56] |
|
[57] |
|
[58] |
|
[59] |
|
[60] |
|
[61] |
|
[62] |
|
[63] |
|
[64] |
|
[65] |
|
[66] |
|
[67] |
|
[68] |
|
[69] |
|
[70] |
|
[71] |
|
[72] |
|
[73] |
|
[74] |
|
[75] |
|
[76] |
|
[77] |
|
[78] |
王欣, 王志飞, 王煜. 基于迁移学习的轨道交通特殊OD客流预测研究[J]. 铁道运输与经济, 2024, 46(3):182-188.
[
|
[79] |
任亚捷. 基于迁移学习的电动汽车充电站需求预测研究[D]. 北京: 北京邮电大学, 2021.
[
|
[80] |
|
[81] |
|
[82] |
|
[83] |
刘宝生, 闫莉萍, 周东华. 几种经典相似性度量的比较研究[J]. 计算机应用研究, 2006, 23(11):1-3.
[
|
[84] |
郭澎涛, 朱阿兴, 李茂芬, 等. 基于环境与光谱相似性的橡胶树叶片磷含量局部估测模型[J]. 农业工程学报, 2022, 38(3):204-211.
[
|
[85] |
|
[86] |
|
[87] |
|
[88] |
|
/
〈 |
|
〉 |