区位推荐算法试用于文本地名的空间网络复现——以《三国志》纪传文本为例
赵渺希(1979—),男,湖南湘潭人,博士,教授,博士生导师,研究方向为城市网络、城市与区域研究、城市意象等。E-mail: arzhao@scut.edu.cn |
收稿日期: 2022-10-13
修回日期: 2023-02-15
网络出版日期: 2023-06-30
基金资助
国家自然科学基金项目(52178037)
教育部哲学社会科学研究重大课题攻关项目(20JZD058)
广州市社科规划智库课题(2022GZZK14)
The Research on Spatial Network Replication based on Toponym Co-occurrence by Location Recommendation Model: A Case Study of the History of The Three Kingdoms
Received date: 2022-10-13
Revised date: 2023-02-15
Online published: 2023-06-30
Supported by
National Natural Science Foundation of China(52178037)
Major Research Project in Philosophy and Social Science Foundation of Ministry of Education of China(20JZD058)
Think tank Project of Social Science Planning of Guangzhou(2022GZZK14)
挖掘可表征城市之间联系的信息并进行网络复现,已成为一种研究区域联系的重要研究范式。纪传文本地名的共现网络研究对深化理解历史地理要素、拓展城市网络分析的运用具有重要意义。本文基于对地名共现的空间网络的研究综述,提出基于地名共现词频进行网络分析的改进方法,纳入地名稀缺性及区域优势不对称性测算城市关联度,规避了现有测算方法中缺乏考虑地名稀缺性及边权不对称性所导致的信息失真。在网络复现算法检验上,使用《三国志》地名共现数据集,实现了三国时期州郡网络复现中的地理分布、层级结构表达,同时实现了州郡的区域优势识别。结果表明,新算法相较传统的地名共现算法,其计算结果反映了边权的不对称性,且在有限文本数的效度测试中区位推荐算法提高效度5‰,概率误差低于既有算法,复现地名词频的效果更为稳健。另外,既有算法计算结果均为对称联系,而由区位推荐算法得到的非对称性地域关联数据为判别区域体系的节点层级提供了统计依据。
赵渺希 , 陈佳鸿 , 师浩辰 , 李涛 , 李莉婷 . 区位推荐算法试用于文本地名的空间网络复现——以《三国志》纪传文本为例[J]. 地球信息科学学报, 2023 , 25(7) : 1386 -1404 . DOI: 10.12082/dqxxkx.2023.220786
Digging out the text information that characterizes connections between different cities has gradually become a critical pathway to investigate the regional intercity links and networks. The research on the toponym co-occurrence network based on biographical books is of great significance for deepening the understanding of historical geographical elements. Based on the review of the existing works, this paper puts forward a novel method to calculate the intercity connections based on the toponym co-occurrence word frequency, considering both the weight of the rareness of toponym and regional dominance asymmetry. This approach realizes the expression of geographical and hierarchical features in the network analysis of the History of The Three Kingdoms and realizes the identification of regional imbalance. Results show that (1) compared with the algorithm of Interlocking Network Model (INM) and the algorithm of Divide-By-City-Pair-Frequency (DBCPF), the results of the proposed algorithm of Location Recommendation Model (LRM) reflect the asymmetry of edge weights. In the validity test, the validity of the location recommendation algorithm is increased by 5‰ with a lower probability error compared to the existing algorithms, and the effect of the recurrence of place name word frequency is more robust; (2) the calculation results of the existing algorithms are symmetric, while the asymmetric regional correlation data obtained by LRM provides a statistical basis for identifying the node hierarchy of the regional network.
表1 州郡地名-纪传文本的关系矩阵Tab. 1 Network matrix between biographical texts and the places of prefectures and commanderies |
州郡y1 | 州郡y2 | 州郡y3 | 州郡y4 | 州郡y5 | 州郡y6 | |
---|---|---|---|---|---|---|
文本x1 | 2 | 1 | 1 | 0 | 0 | 0 |
文本x2 | 0 | 0 | 1 | 1 | 0 | 0 |
文本x3 | 0 | 0 | 0 | 2 | 1 | 0 |
文本x4 | 0 | 0 | 0 | 1 | 0 | 1 |
注:自然数代表州郡地名在文本中的出现频次。 |
表2 全书的州郡联系前10位州郡联系对Tab. 2 Top 10 of the connection between prefectures and commanderies value based on The History of the Three Kingdoms |
排序 | 州郡联系对 | 联系度 | 排序 | 州郡联系对 | 联系度 |
---|---|---|---|---|---|
1 | 益州——荆州 | 268.0 | 6 | 荆州——成都 | 189.3 |
2 | 荆州—汉中郡 | 261.9 | 7 | 益州——成都 | 164.4 |
3 | 成都—汉中郡 | 220.0 | 8 | 荆州—南阳郡 | 156.8 |
4 | 荆州—襄阳郡 | 214.8 | 9 | 荆州—江夏郡 | 140.6 |
5 | 益州—汉中郡 | 209.6 | 10 | 荆州——冀州 | 126.1 |
表3 基于头尾划分法的州郡点度前三层级Tab. 3 Top 3 levels of prefectures / commanderies degree based on Head/tail Breaks |
样本(点度) | ||||
---|---|---|---|---|
层级 | 全书 | 魏书 | 蜀书 | 吴书 |
第一层级 | 荆州(2400.1) 汉中(1504.2) | 荆州(1068.7) 冀州(968.6) 洛阳(828.5) 兖州(597.0) | 汉中(866.5) 荆州(815.7) 益州(759.1) 成都(758.3) | 会稽(744.3) 丹杨(554.6) 荆州(515.7) 豫章(433.2) 吴郡(389.5) |
第二层级 | 益州(1153.1) 冀州(1024.9) 洛阳(973.4) 成都(931.2) 会稽(840.6) 南阳(819.7) 辽东(788.6) 襄阳(686.2) | 辽东(592.9) 汉中(557.2) 河东(480.9) 南阳(470.9) 平原(445.0) 陈留(440.2) 河内(439.7) 凉州(439.7) 扬州(418.5) 徐州(415.5) 青州(412.8) 并州(406.6) 颍川(391.2) 山阳(362.4) | 襄阳(246.6) 广汉(235.8) 蜀郡(216.2) 下邳(179.1) 豫州(175.7) 零陵(149.0) | 南郡(320.0) 交州(316.2) 庐江(303.8) 建业(301.5) 鄱阳(269.3) 长沙(254.2) 零陵(226.9) 广陵(223.8) 江夏(222.7) 南阳(212.2) 扬州(191.9) 辽东(189.2) 庐陵(184.0) 襄阳(182.3) 武陵(147.3) |
第三层级 | 丹杨(667.3) 徐州(663.6) 兖州(642.6) 扬州(629.7) 凉州(617.0) 平原(600.9) 豫州(589.7) 颍川(557.9) 河东(526.9) 下邳(523.4) 淮南(521.3) 青州(518.2) 南郡(506.0) 汝南(503.7) 豫章(499.4) 江夏(490.2) 河内(490.0) 陈留(482.0) 庐江(479.5) 长沙(465.3) 山阳(458.0) 广陵(454.9) 零陵(443.6) 并州(416.9) 交州(415.2) 吴郡(402.6) 东郡(367.5) | 淮南(346.7) 豫州(333.5) 东郡(330.2) 幽州(308.0) 汝南(299.7) 河南(290.9) 下邳(280.9) 安定(278.1) 益州(269.1) 泰山(267.6) 襄阳(257.3) 新城(256.0) 魏郡(248.0) 弘农(244.2) 东海(223.8) 东平(198.9) | 凉州(137.9) 南阳(136.6) 南郡(132.8) 巴西(131.6) 扶风(117.5) 徐州(109.0) 平原(106.2) 长沙(104.8) 上庸(104.3) 汝南(100.42) 犍为(99.5) 汶山(98.7) 武陵(95.5) 武都(92.9) 阴平(86.6) 雍州(86.0) 颍川(83.4) 巴郡(83.3) 江夏(83.3) 牂牁(82.2) 洛阳(81.2) 桂阳(71.9) | 徐州(139.1) 苍梧(129.5) 淮南(129.2) 琅邪(127.4) 益州(124.9) 合浦(123.8) 南海(112.1) 汝南(103.6) 北海(96.6) 新城(94.5) 宜都(92.3) 颍川(83.3) 桂阳(81.8) 豫州(80.5) 汉中(80.5) 建平(76.9) 郁林(70.2) |
表4 全书的州级联系前10位州联系对Tab. 4 Top 10 of prefecture-in-pair’s value based on The History of the Three Kingdoms |
排序 | 州联系对 | 联系度 | 排序 | 州联系对 | 联系度 |
---|---|---|---|---|---|
1 | 益州——荆州 | 259.8 | 6 | 冀州——洛阳 | 86.9 |
2 | 荆州——成都 | 198.8 | 7 | 荆州——洛阳 | 79.7 |
3 | 益州——成都 | 158.2 | 8 | 荆州——徐州 | 78.3 |
4 | 荆州——豫州 | 120.4 | 9 | 冀州——青州 | 75.1 |
5 | 荆州——冀州 | 115.2 | 10 | 荆州——青州 | 72.5 |
图7 基于《三国志》全书的郡联系网络图Fig. 7 Commandery network based on The History of the Three Kingdoms |
表5 《三国志 全书》的郡级联系前10位联系对Tab. 5 Top 10 of commandery-in-pair’s value based on The History of the Three Kingdoms |
排序 | 郡联系对 | 联系度 | 排序 | 郡联系对 | 联系度 |
---|---|---|---|---|---|
1 | 成都——汉中郡 | 264.0 | 6 | 辽东郡——玄菟郡 | 82.3 |
2 | 丹杨郡——会稽郡 | 122.4 | 7 | 汉中郡——襄阳郡 | 80.8 |
3 | 豫章郡——会稽郡 | 107.9 | 8 | 汉中郡——河东郡 | 76.1 |
4 | 吴郡——会稽郡 | 93.9 | 9 | 成都——襄阳郡 | 75.5 |
5 | 吴郡——丹杨郡 | 83.3 | 10 | 丹杨郡——庐江郡 | 74.6 |
表6 《三国志 魏书》的州郡联系前10位州郡联系对Tab. 6 Top 10 of state-in-pair’s value based on The History of Wei Dynasty |
排序 | 州郡联系对 | 联系度 | 排序 | 州郡联系对 | 联系度 |
---|---|---|---|---|---|
1 | 荆州——冀州 | 115.0 | 6 | 冀州——平原郡 | 84.0 |
2 | 荆州——南阳郡 | 105.0 | 7 | 冀州——青州 | 79.4 |
3 | 荆州——襄阳郡 | 89.8 | 8 | 冀州——洛阳 | 78.8 |
4 | 兖州——徐州 | 85.8 | 9 | 荆州——江夏郡 | 78.7 |
5 | 扬州——淮南郡 | 84.7 | 10 | 荆州——汉中郡 | 73.9 |
表7 《三国志 蜀书》的州郡联系前10位州郡联系对Tab. 7 Top 10 of state-in-pair's value based on The History of Shu Dynasty |
排序 | 州郡联系对 | 联系度 | 排序 | 州郡联系对 | 联系度 |
---|---|---|---|---|---|
1 | 成都——汉中郡 | 213.5 | 6 | 益州——成都 | 140.7 |
2 | 益州——汉中郡 | 177.4 | 7 | 荆州——襄阳郡 | 89.0 |
3 | 荆州——汉中郡 | 177.4 | 8 | 益州——广汉郡 | 86.1 |
4 | 益州——荆州 | 173.0 | 9 | 凉州——汉中郡 | 61.0 |
5 | 荆州——成都 | 162.2 | 10 | 成都——襄阳郡 | 60.3 |
表8 《三国志 吴书》的州郡联系前10位州郡联系对Tab. 8 Top 10 of state-in-pair's value based on The History of Wu Dynasty |
排序 | 州郡联系对 | 联系度 | 排序 | 州郡联系对 | 联系度 |
---|---|---|---|---|---|
1 | 丹杨郡——会稽郡 | 112.4 | 6 | 荆州——会稽郡 | 62.4 |
2 | 会稽郡——豫章郡 | 93.8 | 7 | 交州——会稽郡 | 62.0 |
3 | 会稽郡——吴郡 | 85.3 | 8 | 丹杨郡——豫章郡 | 61.3 |
4 | 丹杨郡——吴郡 | 75.4 | 9 | 荆州——南郡 | 60.4 |
5 | 丹杨郡——庐江郡 | 64.1 | 10 | 会稽郡——广陵郡 | 52.9 |
表9 州郡联系的区位优势判别Tab. 9 The location advantage discrimination based on prefecture-commandery connections |
类型 | 数量/个 | 州郡 |
---|---|---|
明显优势 | 37 | 荆州(-0.495 00)**、汉中(-0.317 70)**、洛阳(-0.204 30)**、益州(-0.202 20)**、辽东(-0.179 00)**、冀州(-0.170 10)**、会稽(-0.162 30)**、成都(-0.150 00)**、南阳(-0.128 90)**、丹杨(-0.082 64)**、凉州(-0.079 94)**、淮南(-0.077 27)**、徐州(-0.071 24)**、兖州(-0.069 83)**、襄阳(-0.069 30)**、颍川(-0.066 87)**、平原(-0.061 01)**、扬州(-0.056 14)**、广陵(-0.051 34)**、豫州(-0.050 08)**、河内(-0.048 51)**、南郡(-0.047 70)**、交州(-0.046 88)**、河东(-0.043 90)**、汝南(-0.043 80)**、庐江(-0.041 43)**、豫章(-0.040 63)**、吴郡(-0.038 47)**、长沙(-0.036 56)**、河南(-0.035 98)**、金城(-0.033 76)**、山阳(-0.033 28)**、江夏(-0.032 06)**、陈留(-0.029 65)**、安定(-0.028 21)* 、琅邪(-0.023 74)**、东海(-0.018 78)** |
一般区位 | 31 | 幽州(-0.032 42)、建业(-0.017 67)、新城(-0.014 77)、并州(-0.014 25)、青州(-0.014 17)、东郡(-0.013 22)、泰山(-0.011 37)、东平(-0.009 92)、北海(-0.009 12)、武陵(-0.005 39)、下邳(-0.004 54)、广汉(-0.004 47)、蜀郡(-0.002 86)、魏郡(-0.001 16)、苍梧(-0.000 14)、雍州( 0.000 85)、南安( 0.001 26)、扶风( 0.001 47)、鄱阳( 0.002 41)、河间(0.004 42、彭城( 0.004 84)、武都( 0.005 46)、京兆(0.00567)、涿郡(0.008 31)、陇西(0.009 85)、武威(0.010 89)、南海(0.011 41)、太原(0.011 72)、交趾(0.012 37)、巴西(0.012 79)、零陵(0.013 30) |
相对劣势 区位 | 86 | 平阳(0.012 95)**、济阴(0.013 61)**、冯翊(0.013 65)* 、新都(0.014 03)**、沛国(0.014 87)* 、西平(0.015 10)*、乐安(0.016 91)**、东莱(0.018 69)* 、安平(0.019 62)* 、上党(0.019 99)**、梓潼(0.020 16)**、安丰(0.021 05)**、乐陵(0.021 06)**、宜都(0.022 22)**、九真(0.022 23)**、常山(0.023 59)**、巴郡(0.024 54)**、广平(0.024 74)**、东莞(0.025 38)**、清河(0.026 10)**、陈郡(0.026 51)**、阳平(0.027 54)**、衡阳(0.028 20)**、庐陵(0.030 06)**、乐平(0.030 27)**、乐浪(0.030 31)* 、牂牁(0.031 02)**、齐国(0.031 04)**、巴东(0.031 17)**、新平(0.032 22)**、济南(0.032 74)**、犍为(0.033 36)**、日南(0.033 99)**、天水(0.034 21)**、江阳(0.034 58)**、弋阳(0.035 38)**、南乡(0.035 54)**、赵国(0.035 73)**、鲁郡(0.036 16)**、渤海(0.036 56)**、弘农(0.036 78)**、临海(0.037 48)**、谯郡(0.037 70)**、越巂(0.038 05)**、雁门(0.038 17)**、城阳(0.038 75)**、临川(0.039 69)**、渔阳(0.039 76)**、桂阳(0.039 93)**、汉嘉(0.039 99)**、代郡(0.040 02)**、西海(0.040 03)**、新兴(0.041 24)**、上谷(0.041 31)**、燕国(0.041 33)**、涪陵(0.042 25)**、中山(0.043 02)**、司州(0.043 05)**、临贺(0.043 28)**、高凉(0.043 29)**、永昌(0.043 60)**、抚夷(0.043 74)**、昌黎(0.044 79)**、任城(0.044 81)**、湘东(0.045 39)**、建平(0.046 00)**、敦煌(0.048 37)**、汶山(0.048 80)**、酒泉(0.049 61)**、阴平(0.051 59)**、郁林(0.052 71)**、右北平(0.053 61)**、济北(0.053 78)**、北地(0.057 07)**、建安(0.058 16)**、魏兴(0.058 18)**、广魏(0.058 79)**、辽西(0.059 31)**、梁国(0.060 67)**、合浦(0.060 74)**、蕲春(0.062 05)**、张掖(0.064 09)**、带方(0.068 15)* 、上庸(0.079 22)**、西河(0.115 80)**、玄菟(0.135 90)* |
注:括号内数字为s值的平均值,*表示显著性〉95%,**表示显著性〉99%。 |
[1] |
王妮满, 秦昆, 罗俊, 等. 历史名人轨迹的空间可视化与分析[J]. 地球信息科学学报, 2020, 22(5):978-988.
[
|
[2] |
武洋. 第二次世界大战期间英国反情报工作研究[D]. 长沙: 国防科技大学, 2020.
[
|
[3] |
赵耀龙, 巢子豪. 历史GIS的研究现状和发展趋势[J]. 地球信息科学学报, 2020, 22(5):929-944.
[
|
[4] |
张雪英, 张春菊, 闾国年. 地理命名实体分类体系的设计与应用分析[J]. 地球信息科学学报, 2010, 12(2):2220-2227.
[
|
[5] |
|
[6] |
|
[7] |
|
[8] |
|
[9] |
|
[10] |
|
[11] |
|
[12] |
|
[13] |
|
[14] |
蒙文清, 尹章才. 基于地名互现的城市联系强度研究——以湖北省为例[J]. 测绘地理信息, 2020, 45(2):31-34.
[
|
[15] |
胡定利, 李锐, 孟瑶, 等. 新闻地名共现视角下的中国城市网络[J]. 武汉大学学报·信息科学版, 2020, 45(2):281-288.
[
|
[16] |
|
[17] |
龚致嘉. 基于新闻文本信息的城市关联网络分析[D]. 北京: 中国地质大学(北京), 2021.
[
|
[18] |
|
[19] |
|
[20] |
|
[21] |
|
[22] |
|
[23] |
|
[24] |
|
[25] |
|
[26] |
|
[27] |
晋陈寿撰, 宋裴松之注. 三国志[M]. 北京: 中华书局, 1999.
[
|
[28] |
谭其骧. 简明中国历史地图集[M]. 北京: 中国地图出版社, 1991.
[
|
[29] |
|
[30] |
|
[31] |
|
[32] |
宋杰. 三国兵争要地与攻守战略研究[M]. 北京: 中华书局, 2019.
[
|
[33] |
张兴照. 孙吴“限江自保”国策刍议[J]. 湖北文理学院学报, 2016, 37(04):10-14.
[
|
[34] |
陈健梅. 从政区建置看吴国在长江沿线的攻防策略——以吴、魏对峙为背景的考察[J]. 中国史研究, 2010(1):71-85.
[
|
[35] |
|
[36] |
|
[37] |
|
[38] |
|
/
〈 |
|
〉 |