区位推荐算法试用于文本地名的空间网络复现——以《三国志》纪传文本为例

  • 赵渺希 , 1, 2 ,
  • 陈佳鸿 1, 2 ,
  • 师浩辰 1, 2 ,
  • 李涛 , 3, 4, * ,
  • 李莉婷 5
展开
  • 1.华南理工大学建筑学院,广州 510640
  • 2.华南理工大学亚热带建筑科学国家重点实验室,广州 510640
  • 3.复旦大学社会发展与公共政策学院,上海 200433
  • 4.上海空间规划设计研究院有限公司,上海 200433
  • 5.复旦大学历史地理研究中心,上海 200433
*李 涛(1982—),男,山东青岛人,博士,研究方向为城市网络和城市体系。E-mail:

赵渺希(1979—),男,湖南湘潭人,博士,教授,博士生导师,研究方向为城市网络、城市与区域研究、城市意象等。E-mail:

收稿日期: 2022-10-13

  修回日期: 2023-02-15

  网络出版日期: 2023-06-30

基金资助

国家自然科学基金项目(52178037)

教育部哲学社会科学研究重大课题攻关项目(20JZD058)

广州市社科规划智库课题(2022GZZK14)

The Research on Spatial Network Replication based on Toponym Co-occurrence by Location Recommendation Model: A Case Study of the History of The Three Kingdoms

  • ZHAO Miaoxi , 1, 2 ,
  • CHEN Jiahong 1, 2 ,
  • SHI Haochen 1, 2 ,
  • LI Tao , 3, 4, * ,
  • LI Liting 5
Expand
  • 1. School of Architecture, South China University of Technology, Guangzhou 510640, China
  • 2. State Key Laboratory of Subtropical Building Science, South China University of Technology, Guangzhou 510640, China
  • 3. School of social development and public policy, Fudan University, Shanghai 200433, China
  • 4. Shanghai Spatial Planning and Design Institute, Shanghai 200433, China
  • 5. Center for Historical Geographical Studies of Fudan University, Shanghai 200433, China
*LI Tao, E-mail:

Received date: 2022-10-13

  Revised date: 2023-02-15

  Online published: 2023-06-30

Supported by

National Natural Science Foundation of China(52178037)

Major Research Project in Philosophy and Social Science Foundation of Ministry of Education of China(20JZD058)

Think tank Project of Social Science Planning of Guangzhou(2022GZZK14)

摘要

挖掘可表征城市之间联系的信息并进行网络复现,已成为一种研究区域联系的重要研究范式。纪传文本地名的共现网络研究对深化理解历史地理要素、拓展城市网络分析的运用具有重要意义。本文基于对地名共现的空间网络的研究综述,提出基于地名共现词频进行网络分析的改进方法,纳入地名稀缺性及区域优势不对称性测算城市关联度,规避了现有测算方法中缺乏考虑地名稀缺性及边权不对称性所导致的信息失真。在网络复现算法检验上,使用《三国志》地名共现数据集,实现了三国时期州郡网络复现中的地理分布、层级结构表达,同时实现了州郡的区域优势识别。结果表明,新算法相较传统的地名共现算法,其计算结果反映了边权的不对称性,且在有限文本数的效度测试中区位推荐算法提高效度5‰,概率误差低于既有算法,复现地名词频的效果更为稳健。另外,既有算法计算结果均为对称联系,而由区位推荐算法得到的非对称性地域关联数据为判别区域体系的节点层级提供了统计依据。

本文引用格式

赵渺希 , 陈佳鸿 , 师浩辰 , 李涛 , 李莉婷 . 区位推荐算法试用于文本地名的空间网络复现——以《三国志》纪传文本为例[J]. 地球信息科学学报, 2023 , 25(7) : 1386 -1404 . DOI: 10.12082/dqxxkx.2023.220786

Abstract

Digging out the text information that characterizes connections between different cities has gradually become a critical pathway to investigate the regional intercity links and networks. The research on the toponym co-occurrence network based on biographical books is of great significance for deepening the understanding of historical geographical elements. Based on the review of the existing works, this paper puts forward a novel method to calculate the intercity connections based on the toponym co-occurrence word frequency, considering both the weight of the rareness of toponym and regional dominance asymmetry. This approach realizes the expression of geographical and hierarchical features in the network analysis of the History of The Three Kingdoms and realizes the identification of regional imbalance. Results show that (1) compared with the algorithm of Interlocking Network Model (INM) and the algorithm of Divide-By-City-Pair-Frequency (DBCPF), the results of the proposed algorithm of Location Recommendation Model (LRM) reflect the asymmetry of edge weights. In the validity test, the validity of the location recommendation algorithm is increased by 5‰ with a lower probability error compared to the existing algorithms, and the effect of the recurrence of place name word frequency is more robust; (2) the calculation results of the existing algorithms are symmetric, while the asymmetric regional correlation data obtained by LRM provides a statistical basis for identifying the node hierarchy of the regional network.

1 引言

在全球化、信息化背景下城市网络研究日臻成熟,但历史地理视角下的地域网络联系面临数据资料匮乏的严峻现实。随着网络分析方法不断融入文献计量,基于历史古籍的地名共现为空间网络复现提供一个崭新的视角。历史地名是历史地理信息的重要组成部分,在分析重要历史人物轨迹(反映人物重要活动的一系列空间位置),深化理解历史地理要素有重要作用[1]。地名及其表征的地理区域与国家政治、军事、民族、主权等问题密切联系,能直接或间接反映特定时期的社会经济地理过程,其中语言的地名词频可表征人类时空行为的规律性,例如二战中英国首相丘吉尔颁令限制地名、代号在电报文本中的使用以防德军窃取机密[2]。随着信息化技术的发展和地理信息系统在历史学、地理学中的应用,历史地理信息系统应运而生[3],这为城市研究者将现代科学技术和空间分析引入历史研究、重新审视历史学中空间信息的价值提供重要的基础支撑,并为历史地名要素的研究注入了动力。
跨学科视角下的网络复现对于研究历史地理学中城市体系等级规模分布、城市关联作用以及城市体系网络演化机制有重要意义。地名是现实世界中常用的地理参照系统[4],历史人物在历史城市间的活动体现在历史古籍的诸多地名之间。地名共现在历史古籍中广泛存在,若2个地名处于同一文本则认为存在“共现”。文章不是由孤立的文字组成,而是由连贯上下文构成的结构化文本[5]。因此,可以根据地名在同一上下文中同时出现的频次来推断地名间的关系,这也为推断特定历史时期的复杂地域网络提供了探索性的研究视角。纪传人物在古代城市间的社会流动是基于纪传文本的地名共现构建古代城市联系的内在逻辑,即同一文本下的地名共现很大程度上来自于纪传人物生平曾生活或踏足的影响范围,可以认为该类地名共现关系的含义具有一定现实基础。类似的研究思路可见于Taylor[6]以代表“现代科学兴起”的1 000名科学家的职业路径为基础展开的城市网络研究。
近年来,将城市网络这一现代科学方法与城市考古学相结合日益受到学术界的重视并成为一个重要研究方向。其中,丹麦奥胡斯大学的城市网络演化中心致力于从社会网络视角重新考察考古材料。研究表明,城市网络可能在历史上多次重大社会变化中发挥关键作用,如罗马帝国的崛起、公元13世纪的蒙古世界体系等[7]。地名共现作为一种关系度的衡量标准被应用于城市网络始于Tobler与Wineburg对公元前19世纪赫梯帝国的奴隶贸易网络的探索[8],该探索基于空间邻近性判断当时贸易城镇的地理位置,认为“在同一文本中出现的城镇可能比不一起出现的城镇距离更近”,其中的重要假设是托布勒法则[9](Tobler's first law)。Gottman[10]、 Pred[11]等都曾对传统新闻报纸的内容进行城市联系研究,而国内学者Zhao等[12]也较早研究长三角新闻城市地名词频的联系。共现网络的重要假设是当 2个地名被频繁提及时,则表明地名之间具有很强的联系。当在文本数据上选择以历史人物传记为研究对象时,虽然在共现网络当中仍存在部分“象征性”含义的共现关系,但该方法本身具备的应用潜力却不应被忽视。地名共现是一种低成本、适用性广、综合性强的分析方法,其构建城市联系的潜力正被挖掘,其中共现网络的空间邻近性与复杂 性[13-14]、网络中心性[15-17]、距离衰减效应[6,14,18]、网络嵌入对发展的重要性[16]等均得到较好揭示。然而,城市间联系发生的内在机理具有复杂性,且不同语义关联具有不同的距离衰减效应[9],地名共现的进一步精确实现还需要识别文本中不同类型的语义关联[19-20],同时尽可能避免地名歧义的出现[21-22]
既有文献为本文积累了大量理论支撑与分析方法,但在测算方法上存在一定不足。地名共现网络的本质是以地名共现频数衡量2个地名之间的城市联系。衡量城市关联度最广泛的模型是Taylor提出的连锁模型[12-21],为便于区分其他改进算法,将连锁模型的初始算法称为“INM算法”(Interlocking Network Model, INM)。前述文章[13-14,16-21]基于地名共现使用连锁模型的单一值量化共现网络的城市联系,主要依靠的是出现地名共现的频次,虽然能够低成本进行分析,但是在城市关联度的测算上没有考虑以下问题: ① 同一文本出现多个地名、各地名词频不同的影响。胡定利[14]基于新闻地名词频提出了城市对均分算法(Division By City Pair Frequency, DBCPF),归纳为“文本中出现的总地名数越少,单一地名对的关联强度越大;文本中某地名的词频越高,包含该地名的地名关联强度越大”,即地名之间具有附加值差异; ② 城市对联系具有不对称性。INM算法体现的词频共现网络联系是对称的,体现不出地区间资源的差异性。已有文献[13,16,22]对边权展开了初步探索,当考虑2个地名同时出现的频数和各自全部出现的次数时,则出现一个有意义的“方向”,即地名词频反映的地名区位优势体现为地名之间的区域不对称性。
如何更真实地测量共现网络的关联度以便展开网络分析是重要的方法论问题。为深化地名共现词频的网络复现方法,本文基于《三国志》的州郡地名共现,提出一种新的测度方法——区位推荐算法(Location Recommendation Model, LRM),即纳入地名稀缺性及区域优势不对称性权重以改进现有INM算法在度量城市联系度时未考虑单篇文本中出现地名个数、各地名词频及地名区位优势的不足。基于历史古籍等文本资料的地名共现中推导城市联系,是考察地域联系方便有效的工具。同时,地名共现在适用不同尺度地域方面具有更大的潜力,包括社区、区域、国家等多种地理尺度。本质上,本研究提出的LRM算法是基于连锁模型对初始算法的联系度进行资源分配的改进,有助于在缺乏目标区域社会经济数据时,通过相对易获取的人物传记等文本的地名共现分析,以更有效的地名共现算法实现城市区位优势的判别。

2 研究方法

本文基于《三国志》纪传文本的地名共现提出区位推荐算法,比较应用于地名共现的不同算法之间的效度,其中,为缩减篇幅,DBCPF算法结果仅作为对照算法进行效度分析,并且后续的实证研究以改进后的算法生成三国时期州郡地域网络,仅对重要的都城、州府开展不对称分析。相关技术路线如图1所示。
图1 基于区位推荐算法的地名共现空间网络复现技术路线

Fig. 1 Framework of toponym co-occurrence network by the algorithm of LRM

2.1 地名关联的一般方法:INM算法

在城市网络领域中,Taylor依据流动空间的学说[23],较早地采用“网络方法”定量研究全球化时代的世界城市体系,并以此为依据对世界城市的关联度加以度量。一般称Taylor提出的“网络方法”为连锁模型[24],通过此模型可将“公司——城市”的二模网络数据用以计算城市联系。在州郡地名共现情景下,基础计算如下。
借鉴连锁模型将《三国志》的州郡地名集合、纪传文本集合构建为一个初始关系矩阵(表1)。其中,地名提取方法是基于地名索引表检索文本内出现词频,并根据上下文筛除引起地名歧义的频次,如指时间的“建安”年号与指地名的“建安”郡名意义不同。连锁模型实际上是将州郡—文本型的二模网络转置相乘形成的州郡—州郡的一模网络,公式如下:
C α β = V α j · V β j
式中: V α jj文本中α州郡的地名词频数; V β jj文本中β州郡的词频; C α β是基于全部文本表示的州郡α与州郡β的基本连接关系量。举例来说,若存在纪传文本j同时出现1个州郡y1地名和1个y2地名,则可认为文本j中州郡y1与y2的联系为1×1 = 1。因此表1中存在2个y1地名和1个y2地名则视文本x1中州郡y1与y2的联系为2×1 = 2,以此类推。
表1 州郡地名-纪传文本的关系矩阵

Tab. 1 Network matrix between biographical texts and the places of prefectures and commanderies

州郡y1 州郡y2 州郡y3 州郡y4 州郡y5 州郡y6
文本x1 2 1 1 0 0 0
文本x2 0 0 1 1 0 0
文本x3 0 0 0 2 1 0
文本x4 0 0 0 1 0 1

注:自然数代表州郡地名在文本中的出现频次。

2.2 地名关联的模型改进:LRM算法

尽管INM算法实现了州郡联系的分析,但是这种二模网络计算方法没有考虑每篇纪传体容纳州郡地名个数以及各地名词频的能力。依旧用前述4篇文本、6个州郡的集合进行分析,图2是以纪传体文本x1、x2、x3、x4对于6个州郡的包络关系来表达州郡网络,在连锁模型中州郡y3、y4的网络联系度都为1,但是前者涉及的纪传体文本篇数是2个,而后者涉及的纪传体文本数是3个,如果按照纪传体文本的数量来看,连锁模型的计算结果忽略了每篇文本涉及的州郡数量的影响:州郡y4在x2、x3、x4等3个纪传体文本都有着重要的地位,一旦州郡y4丢失则这3篇纪传体的州郡网络均无法形成;而对于州郡y3,除去文本x2以外,文本x1拥有另1处州郡,因而x1不会因为州郡y3不在网络而导致全部联系的消失。
图2 连锁模型下的州郡联系

Fig. 2 Illustration of prefecture - commandery connections in the INM

对于任何一个州郡,通过纪传体文本的状况就可以判断自身在网络中的地位。例如,《夏侯惇传》(①《三国志·夏侯惇传》。)篇幅较短,只提及8个州郡,但是《武帝纪》(②《三国志·武帝纪》。)却提及87个州郡,可见《武帝纪》在网络中的地位更高。假定每个纪传人物的重要性一致,则该人物列传中提及的州郡代表了对州郡的一种区位推荐,《武帝纪》每一个州郡带来的区位份额为1/87,而《夏侯惇传》为相应州郡带来的区位份额为1/8。正如一篇论文的作者人数一样,独著论文给作者带来的荣誉更高,而多人合作的论文将稀释每个参与者的贡献程度。因此,重新检视纪传体的文本特征可以发现,《夏侯惇传》这类具有强烈地域性的纪传体更能反映某个州郡的重要性,而长篇幅本纪类纪传体并非是表征州郡重要性的最佳文本载体。从这个角度来看, INM算法并不能客观地反映高附加值区位的稀缺性需求。
鉴于INM算法的不足, Zhao等[26]在国内学者Zhou等[25]的算法的基础上提出了城市网络的区位推荐模型。借鉴其区位推荐的思想, LRM算法具体步骤如下。
首先计算出网络中州郡αβ之间的联系度,公式如下:
L α β = j = 1 m V α j · V β j k ( y j )
式中: k ( y j )为全部州郡节点在文本j中出现的总数; L α β表示州郡αβ在全部纪传体文本的联系。每个州郡最多有n-1个这样的联系。具体地,区分州、郡时 k ( y j )的计算均依照各人物纪传的地名总数,一方面是考虑到地名总数也反映了纪传文本的篇幅,即长篇幅的重要历史人物纪传体文本涉及的地名数较多,按照Zhou等[25]原始定义也具有“资源”分配的必要;另一方面,过短的纪传体文本(例如相对次要的后妃、大臣)地名数量少,若过度区分州、郡则导致区域联系矩阵更为稀疏、地名信息过少而难以复现历史网络。考虑纪传体文本篇幅存在差异而在式(2)引入地名重要性权重,在保证连锁模型的初始定义的基础上凸显了州郡——文本二模网络中较短篇幅纪传体的地名稀缺性。
其次,计算网络内每个州郡α网络联系的总和联系 N α
N α = L α β α β
式中: N α是州郡α在网络中的点度,若一个州郡的点度高,则说明其很好地融入到整个纪传体网络之中。
由于地理的非均匀性,州郡地域间联系存在不对称性,作为网络连边两端节点的地名在不同纪传体中的共现词频差异反映了方向性的地域社会联系。然而,既有的词频共现网络与连锁模型的初始算法给节点两端的赋值是完全一致的,反映出任意2个州郡联系是完全对称的,这种无向的联系体现不出州郡资源的差异性。因此,网络复现的算法既要反映语义网络的区域连通性,又能体现不同纪传体人物社会活动对于特定地域的区位偏好,即任意一对联系在2个地点之间的推荐作用可能是不对称的。
最后,式(4)、式(5)是LRM算法中生成区位推荐的关键步骤,延续Zhou等[25]关于二模网络的分析方法,将目标地域在不同纪传体中的出现频数作为判别依据,边联系ωαβ表示每一个州郡α与州郡β的连边中州郡α端的联系度:
ω α β = 1 k ( x β ) j = 1 m V α j · V β j k ( y j ) = j = 1 m V α j · V β j k ( y j ) · k ( x β )
类似地, ω β α表示每一个州郡α与州郡β的连边中州郡β端的联系度:
ω β α = 1 k ( x α ) j = 1 m V α j · V β j k ( y j ) = j = 1 m V α j · V β j k ( y j ) · k ( x α )
在这一算法中,边联系ωαβ ω β α组成的不对称矩阵W={ωαβ}n×n代表了原有二模网络拆分后在各个州郡形成的地域网络。 k ( x β )表示州郡β与所连接的纪传文本之间连边的权重总和;ωαβ表示当已知 k ( x β ),在州郡β 视角下州郡α 的重要性。

3 州、郡的地域网络模拟

3.1 研究范围

三国时期实行州郡县三级行政制度,州郡地方官员兼领军队,导致各地政权对峙、军队频繁对抗。在此背景下,本文将结合《三国志》纪传文本的地名共现来复现三国时期州郡共现网络。地名数据源于正史《三国志》(简体字本,中华书局出版,裴松之作注)[27]的州郡地名。该书由西晋史学家陈寿所著,记载了中国三国时期的曹魏、蜀汉、东吴的纪传体断代史。鉴于寿志裴注内容详实、史料置信度高,对本文获取古代州郡地名具有更大意义。本文以三国时期魏、蜀、吴的行政疆域为研究区(图3)(魏国西域长史府不纳入研究范围)[28]。地名的历史地理信息则通过复旦大学的中国历史地理信息平台获取。州郡网络联系分析在于识别出州郡间的网络联系强度的级别并作强度划分。以全书样本为例,经式(2)计算得到的联系度来看(图4),联系对数量超过90%分布于[0,20]区间,属于典型的重尾分布,即具有尾部数量占比小但数值大,而头部数量占比大但数值小的分布特征。Jiang等[29]指出这类分布在地理学范畴研究中广泛存在,而且相较于头部数据,尾部数据具有更高的地理学意义。为更好划分尾部数据,本文采用Jiang基于Scripter研究基础[30]提出的“头尾划分法”[31]对地域网络联系值进行层级划分,由高到低划分为Ⅰ—Ⅴ共5种联系强度,并绘制成相应的州郡网络图。
图3 三国鼎立形势图(公元262年)

Fig. 3 The map of the Three Kingdoms in 262 A.D.

图4 联系对数量分布和分布数量占比

Fig. 4 The histogram of state-in-pair's value and distribution of state-in-pair's value

3.2 全部州郡联系

以《三国志》全书为样本,经式(2)考察三国鼎立时期州郡联系布局发现,跨越魏、蜀、吴国界的联系最为紧密,明显高于魏、蜀、吴领地内部的联系,而位于远离三国交界的偏远州郡之间联系则更弱。在三国鼎立时期,魏与蜀、魏与吴交界之处设置较多边防重镇,即近代军事地理学中的“枢纽地区”。州郡联系基本集中于此,如益州——荆州、荆州——汉中、荆州——襄阳、荆州——南阳等(表2)。图5是基于头尾划分法对全书的州郡联系度进行层级划分结果。从位于Ⅰ级联系度的联系可看出荆州在三国兵争中最为激烈,而汉中是魏、蜀两国相继争夺的要地。
表2 全书的州郡联系前10位州郡联系对

Tab. 2 Top 10 of the connection between prefectures and commanderies value based on The History of the Three Kingdoms

排序 州郡联系对 联系度 排序 州郡联系对 联系度
1 益州——荆州 268.0 6 荆州——成都 189.3
2 荆州—汉中郡 261.9 7 益州——成都 164.4
3 成都—汉中郡 220.0 8 荆州—南阳郡 156.8
4 荆州—襄阳郡 214.8 9 荆州—江夏郡 140.6
5 益州—汉中郡 209.6 10 荆州——冀州 126.1
图5 基于《三国志》全书的州郡联系网络

Fig. 5 Prefecture-commandery network based on The History of the Three Kingdoms

通过计算每个州郡在网络中联系度总和作为所在州郡点度,并用头尾划分法分级排序如表3。荆州的点度处于绝对优势地位,是汉中的1.5倍以上,荆州在三国中的重要性不言而喻。对比三国都城与其他州郡点度,洛阳、成都、建业均小于荆州、汉中,反映出三国时期州郡的军事意义更为凸显。南阳郡是荆州的重要州郡,先后被军阀占领,属于“四战之地” [32],地理位置优势明显,在点度层级上得以突出。第二层级的州郡地理分布大致有2个地区,一是魏国所在的中原地区,二是三国边境交界的长江流域一带。一方面中原地区自汉末以来长期战乱,另一方面长江流域地处北方政权与南方对峙的交界,战争频繁。这表明,在以军事活动联系为主的三国时期,具有地理优势、具备一定发展基础的州郡在网络中节点能级相对突出。第四层级的州郡相对集中在益州南部、凉州以及交州,是由于这些地区偏远荒僻、人烟稀少,网络节点意义不够凸显。
表3 基于头尾划分法的州郡点度前三层级

Tab. 3 Top 3 levels of prefectures / commanderies degree based on Head/tail Breaks

样本(点度)
层级 全书 魏书 蜀书 吴书
第一层级 荆州(2400.1)
汉中(1504.2)
荆州(1068.7)
冀州(968.6)
洛阳(828.5)
兖州(597.0)
汉中(866.5)
荆州(815.7)
益州(759.1)
成都(758.3)
会稽(744.3)
丹杨(554.6)
荆州(515.7)
豫章(433.2)
吴郡(389.5)
第二层级 益州(1153.1)
冀州(1024.9)
洛阳(973.4)
成都(931.2)
会稽(840.6)
南阳(819.7)
辽东(788.6)
襄阳(686.2)
辽东(592.9)
汉中(557.2)
河东(480.9)
南阳(470.9)
平原(445.0)
陈留(440.2)
河内(439.7)
凉州(439.7)
扬州(418.5)
徐州(415.5)
青州(412.8)
并州(406.6)
颍川(391.2)
山阳(362.4)
襄阳(246.6)
广汉(235.8)
蜀郡(216.2)
下邳(179.1)
豫州(175.7)
零陵(149.0)
南郡(320.0)
交州(316.2)
庐江(303.8)
建业(301.5)
鄱阳(269.3)
长沙(254.2)
零陵(226.9)
广陵(223.8)
江夏(222.7)
南阳(212.2)
扬州(191.9)
辽东(189.2)
庐陵(184.0)
襄阳(182.3)
武陵(147.3)
第三层级 丹杨(667.3)
徐州(663.6)
兖州(642.6)
扬州(629.7)
凉州(617.0)
平原(600.9)
豫州(589.7)
颍川(557.9)
河东(526.9)
下邳(523.4)
淮南(521.3)
青州(518.2)
南郡(506.0)
汝南(503.7)
豫章(499.4)
江夏(490.2)
河内(490.0)
陈留(482.0)
庐江(479.5)
长沙(465.3)
山阳(458.0)
广陵(454.9)
零陵(443.6)
并州(416.9)
交州(415.2)
吴郡(402.6)
东郡(367.5)
淮南(346.7)
豫州(333.5)
东郡(330.2)
幽州(308.0)
汝南(299.7)
河南(290.9)
下邳(280.9)
安定(278.1)
益州(269.1)
泰山(267.6)
襄阳(257.3)
新城(256.0)
魏郡(248.0)
弘农(244.2)
东海(223.8)
东平(198.9)
凉州(137.9)
南阳(136.6)
南郡(132.8)
巴西(131.6)
扶风(117.5)
徐州(109.0)
平原(106.2)
长沙(104.8)
上庸(104.3)
汝南(100.42)
犍为(99.5)
汶山(98.7)
武陵(95.5)
武都(92.9)
阴平(86.6)
雍州(86.0)
颍川(83.4)
巴郡(83.3)
江夏(83.3)
牂牁(82.2)
洛阳(81.2)
桂阳(71.9)
徐州(139.1)
苍梧(129.5)
淮南(129.2)
琅邪(127.4)
益州(124.9)
合浦(123.8)
南海(112.1)
汝南(103.6)
北海(96.6)
新城(94.5)
宜都(92.3)
颍川(83.3)
桂阳(81.8)
豫州(80.5)
汉中(80.5)
建平(76.9)
郁林(70.2)

3.3 州联系

州郡在行政层级上属于上下关系、空间上为包含关系,当“州”作为地名出现时可能存在2种语义,一是指州的整个地域空间范围,二是指州府所在地,即与郡在空间上属于并列关系。如《关羽传》中“先主西定益州,拜羽董督荆州事。”(③《三国志·关张马黄赵传》。),关羽被任命处理荆州事宜,此处上述2种州地名的语义均可进行理解。但根据目前的技术,尚无法对这一部分州地名做出更好的区分,这是论文的局限之一。鉴于此,本文尝试区分州、郡两级地名,以全书样本为例展开分析,克服州郡层级的可能影响。州联系网络图如图6所示。
图6 基于《三国志》全书的州联系网络图

Fig. 6 Prefecture network based on The History of the Three Kingdoms

从州级联系的前10位联系对来看(表4),由于本次计算仅计入了全部州级地名节点在文本j中出现的总数,导致联系度与前文3.1节存在差异。但全部文本的州级联系反映了《三国志》中州级地名的重要性,如“益州——荆州”的联系度前后变化幅度仅为3%。
表4 全书的州级联系前10位州联系对

Tab. 4 Top 10 of prefecture-in-pair’s value based on The History of the Three Kingdoms

排序 州联系对 联系度 排序 州联系对 联系度
1 益州——荆州 259.8 6 冀州——洛阳 86.9
2 荆州——成都 198.8 7 荆州——洛阳 79.7
3 益州——成都 158.2 8 荆州——徐州 78.3
4 荆州——豫州 120.4 9 冀州——青州 75.1
5 荆州——冀州 115.2 10 荆州——青州 72.5

3.4 郡联系

延续3.2节的做法,本节以“郡级地名——纪传文本”建立的数据库进行网络分析(图7)。从前十位的郡联系对来看(表5),蜀国和吴国的地域内部联系分别有所凸显,即汉中与成都、吴国内部丹杨、豫章与会稽等联系密切;而在魏国内部仅有辽东与玄菟,这显然与三国的实际兵争情况不符。全书的郡级地名共现联系出现“异常”的原因在于忽视了州级地名作为州府意义的重要性。为说明以“州郡地名——纪传文本”数据库建立的关联网络,本研究进行魏蜀吴3个国家的网络复现分析,详细结果见3.5节—3.7节。
图7 基于《三国志》全书的郡联系网络图

Fig. 7 Commandery network based on The History of the Three Kingdoms

表5 《三国志 全书》的郡级联系前10位联系对

Tab. 5 Top 10 of commandery-in-pair’s value based on The History of the Three Kingdoms

排序 郡联系对 联系度 排序 郡联系对 联系度
1 成都——汉中郡 264.0 6 辽东郡——玄菟郡 82.3
2 丹杨郡——会稽郡 122.4 7 汉中郡——襄阳郡 80.8
3 豫章郡——会稽郡 107.9 8 汉中郡——河东郡 76.1
4 吴郡——会稽郡 93.9 9 成都——襄阳郡 75.5
5 吴郡——丹杨郡 83.3 10 丹杨郡——庐江郡 74.6

3.5 魏书的州郡联系

对魏国来说,三国时期联系最密切的是荆州与冀州,而且前十位联系对中大多数与荆州、冀州两地相关,形成了以荆州、冀州为中心向腹地郡国辐射的格局(图8)。相比与吴、蜀的联系,魏国内部的州郡联系更为密切,同时与吴、蜀的联系多位于跨界地区,例如蜀、魏边界的汉中——河东,可见于《武帝纪》中记载曹操西征张鲁夺取汉中,“张鲁据汉中,三月,遣钟繇讨之。公使渊等出河东与繇会”(④《三国志·武帝纪》。);吴、魏边界的扬州——淮南,可见于《吴主传》中孙权在世时对淮南边防重镇合肥发动了6次攻势但全不克,“二年筑东兴堤遏湖水。后征淮南,败,以内船,由是废不复修”(⑤《三国志·吴主传》。)。
图8 基于《三国志》魏书的州郡联系网络图

Fig. 8 State network based on The History of Wei Dynasty

从点度来看,点度层级第一的州郡包含荆州、冀州、洛阳、兖州,反映了作为政治、军事中心的州郡的重要地位。在汉末三国的割据兼并战争中,曹氏进行两次政治、军事重心区域的转移,一次是将军队主力由许都迁往邺城,以冀州为平定中原的王业之本,第二次是向南迁都洛阳,内卫京畿,外征吴蜀[32]。位于第二级的州郡包含凉州、扬州、徐州、青州、徐州等州府及汉中、南阳等重要郡国,均位于魏国内部。这与魏国所在地区为汉朝先进农耕区(⑥司马迁在《史记·货殖列传》中把西汉全国分为山西、山东、江南和龙门、碣石北4个经济区域,魏国此时便占据了其中江南以外的3个。)有关,新增节点多为农耕经济发达、人口众多的州郡,汉末以来诸侯混战也集中于此,曹魏统一中原后成为与吴、蜀对峙的军事节点。例如,南阳郡和第三层级中的襄阳郡是魏国曹操南下争夺南荆的前线。如表6所示。
表6 《三国志 魏书》的州郡联系前10位州郡联系对

Tab. 6 Top 10 of state-in-pair’s value based on The History of Wei Dynasty

排序 州郡联系对 联系度 排序 州郡联系对 联系度
1 荆州——冀州 115.0 6 冀州——平原郡 84.0
2 荆州——南阳郡 105.0 7 冀州——青州 79.4
3 荆州——襄阳郡 89.8 8 冀州——洛阳 78.8
4 兖州——徐州 85.8 9 荆州——江夏郡 78.7
5 扬州——淮南郡 84.7 10 荆州——汉中郡 73.9

3.6 蜀书的州郡联系

对蜀国来说,三国时期州郡联系密切集中于益州/成都、汉中与荆州三大地理单元的联系(表7)。汉中与成都联系密切,可见于《后主传》中记载刘禅先后任命蒋琬、费祎、姜维等人驻守汉中以及诸葛亮在世时多次北伐。荆州于蜀国而言亦为必争之地,而荆州中战略要地则首推襄阳,荆州与襄阳、成都与襄阳的联系反映了襄阳郡对蜀国的重要性,可见于《先主传》中记载刘备入驻汉中后任命关羽为荆州牧,关羽北伐襄樊失利并丢失荆州。
表7 《三国志 蜀书》的州郡联系前10位州郡联系对

Tab. 7 Top 10 of state-in-pair's value based on The History of Shu Dynasty

排序 州郡联系对 联系度 排序 州郡联系对 联系度
1 成都——汉中郡 213.5 6 益州——成都 140.7
2 益州——汉中郡 177.4 7 荆州——襄阳郡 89.0
3 荆州——汉中郡 177.4 8 益州——广汉郡 86.1
4 益州——荆州 173.0 9 凉州——汉中郡 61.0
5 荆州——成都 162.2 10 成都——襄阳郡 60.3
蜀国点度分布整体呈现以益州/成都、汉中与荆州为中心的三角形分布格局(图9)。在蜀国内部存在明显的双中心,即汉中与成都,其他郡国多位于最低的2个层级,点度分布存在南低北高的显著差异,并且联系度较高的也多分布于蜀国北部,反映了北部联系高于南部的特点,可见平定南中对蜀国而言重要性相对较弱。位于魏国的下邳、豫州点度较高,主要是受到刘备依附于各诸侯时曾担任豫州刺史、豫州牧以及据守下邳的影响。
图9 基于《三国志》蜀书的州郡联系网络图

Fig. 9 State network based on The History of Shu Dynasty

3.7 吴书的州郡联系

对吴国来说,其地域范围的内部联系高于外部联系,具有明显的区域性特征(图10)。从表8可看出联系度前五为丹杨——会稽、会稽——豫章、会稽——吴郡、丹杨——吴郡、丹杨——庐江,上述五郡加上庐陵郡合称“江东六郡”,构成孙吴建国立业的基础,而且在空间上同属于一个自然地理单元,因此经济往来、军队人事调动等联系尤为密切[32]。在江东六郡当中,丹杨郡位于吴、魏边界、都城建业所在,而且附近山区是山越活动的中心区域,丹杨郡的重要性不言而喻,可见于《吴主传》中孙权“以诸葛恪为丹杨太守,讨山越”(⑦《三国志·吴主传》。),《朱桓传》中“丹杨、鄱阳山贼蜂起,攻没城郭”⑧(⑧《三国志·朱桓传》。),朱桓领兵平定山越;而吴郡与会稽所辖境域和人口数量名列前茅,物产最为富饶,并称“吴会”,是重要的经济中心[32]
图10 基于《三国志》吴书的州郡联系网络图

Fig. 10 State network based on The History of Wu Dynasty

表8 《三国志 吴书》的州郡联系前10位州郡联系对

Tab. 8 Top 10 of state-in-pair's value based on The History of Wu Dynasty

排序 州郡联系对 联系度 排序 州郡联系对 联系度
1 丹杨郡——会稽郡 112.4 6 荆州——会稽郡 62.4
2 会稽郡——豫章郡 93.8 7 交州——会稽郡 62.0
3 会稽郡——吴郡 85.3 8 丹杨郡——豫章郡 61.3
4 丹杨郡——吴郡 75.4 9 荆州——南郡 60.4
5 丹杨郡——庐江郡 64.1 10 会稽郡——广陵郡 52.9
吴国点度分布呈现出以会稽、丹杨、豫章和吴郡为主要郡国的菱形结构,并以此向外扩散的特征(图10)。扬州主要郡国附加第一层级的荆州和第二层级的南郡(孙吴荆州治所),可见吴据荆扬“限江自保”[33-34]的特点。从点度来看,位于第一、二层级的除襄阳、南阳、广陵、辽东外均位于吴国内部,这与在三国鼎立时期,吴国处于相对防守位置有关。襄阳、南阳和广陵均为魏国要塞,反映孙吴与之争夺的军事意图,可见于《陆逊传》中“权北征。使逊与诸葛瑾攻襄阳”(⑨《三国志·陆逊传》。)、《孙破虏讨逆传》中记载孙坚斩杀南阳太守张咨以及袁术占据南阳时孙坚、孙策曾依附于袁术(⑩《三国志·孙破虏讨逆传》);辽东的点度影响可见于《吴主传》中记载孙权曾与辽东太守公孙渊互派使者来往以及发生数次战争(⑪《三国志·吴主传》)。

3.8 都城、州府的边权不对称性分析

图11是对重要都城、州府的分析结果对比, LRM算法复制了INM算法的部分过程,且相比于INM算法,在都城、州府这一层级中LRM算法反映出的区位优势信息能够更好获取。以荆州为例,在LRM算法下荆州与其他州郡的联系之间产生了较大梯度的信息流动,反映了LRM算法的关键优势。荆州联系的16个州府或都城中,荆州均具有比较优势,靠近荆州的一侧的连接线更粗,反映了该地的战略地位。
图11 基于INM的三国志全书都城、州府的对称联系与基于LRM的不对称联系

Fig. 11 Symmetric connections of (prefecture) capitals by the algorithm of INM and asymmetric connections of (prefecture) capitals by the algorithm of LRM based on The History of the Three Kingdoms

进一步将州的不对称联系扩大至所有的州郡联系(如3.2节所述,州郡层级是否分开其差异幅度为3%)。州郡边权组成的不对称矩阵W={ωαβ}n×n还可以进一步分析各地共同作为人物事件活动频次的能级差异,利用区位推荐算法中的边权ω来分析地域边权联系两端的节点相对优势。由于边权是一个不对称的矩阵,除去纪传体没有提到的州郡和对角线上的缺省值,每一个州郡与其余154个地域单元的双向联系形成了具有差值的数组对,计州郡地域单元αβ之间连边联系的差值(ωαβ-ωβα)为Sαβ,由此对每个地域的154个Sαβ值可以采用非独立样本t检验,以0为测试值可以检验地域间两两联系的非对称性,利用t检验的显著性水平可以将154个地域单元进行类型划分:纪传体文本地域体系中具有明显网络优势、一般网络优势、网络相对劣势等3类地域单元(表9)。
表9 州郡联系的区位优势判别

Tab. 9 The location advantage discrimination based on prefecture-commandery connections

类型 数量/个 州郡
明显优势 37 荆州(-0.495 00)**、汉中(-0.317 70)**、洛阳(-0.204 30)**、益州(-0.202 20)**、辽东(-0.179 00)**、冀州(-0.170 10)**、会稽(-0.162 30)**、成都(-0.150 00)**、南阳(-0.128 90)**、丹杨(-0.082 64)**、凉州(-0.079 94)**、淮南(-0.077 27)**、徐州(-0.071 24)**、兖州(-0.069 83)**、襄阳(-0.069 30)**、颍川(-0.066 87)**、平原(-0.061 01)**、扬州(-0.056 14)**、广陵(-0.051 34)**、豫州(-0.050 08)**、河内(-0.048 51)**、南郡(-0.047 70)**、交州(-0.046 88)**、河东(-0.043 90)**、汝南(-0.043 80)**、庐江(-0.041 43)**、豫章(-0.040 63)**、吴郡(-0.038 47)**、长沙(-0.036 56)**、河南(-0.035 98)**、金城(-0.033 76)**、山阳(-0.033 28)**、江夏(-0.032 06)**、陈留(-0.029 65)**、安定(-0.028 21)* 、琅邪(-0.023 74)**、东海(-0.018 78)**
一般区位 31 幽州(-0.032 42)、建业(-0.017 67)、新城(-0.014 77)、并州(-0.014 25)、青州(-0.014 17)、东郡(-0.013 22)、泰山(-0.011 37)、东平(-0.009 92)、北海(-0.009 12)、武陵(-0.005 39)、下邳(-0.004 54)、广汉(-0.004 47)、蜀郡(-0.002 86)、魏郡(-0.001 16)、苍梧(-0.000 14)、雍州( 0.000 85)、南安( 0.001 26)、扶风( 0.001 47)、鄱阳( 0.002 41)、河间(0.004 42、彭城( 0.004 84)、武都( 0.005 46)、京兆(0.00567)、涿郡(0.008 31)、陇西(0.009 85)、武威(0.010 89)、南海(0.011 41)、太原(0.011 72)、交趾(0.012 37)、巴西(0.012 79)、零陵(0.013 30)
相对劣势
区位
86 平阳(0.012 95)**、济阴(0.013 61)**、冯翊(0.013 65)* 、新都(0.014 03)**、沛国(0.014 87)* 、西平(0.015 10)*、乐安(0.016 91)**、东莱(0.018 69)* 、安平(0.019 62)* 、上党(0.019 99)**、梓潼(0.020 16)**、安丰(0.021 05)**、乐陵(0.021 06)**、宜都(0.022 22)**、九真(0.022 23)**、常山(0.023 59)**、巴郡(0.024 54)**、广平(0.024 74)**、东莞(0.025 38)**、清河(0.026 10)**、陈郡(0.026 51)**、阳平(0.027 54)**、衡阳(0.028 20)**、庐陵(0.030 06)**、乐平(0.030 27)**、乐浪(0.030 31)* 、牂牁(0.031 02)**、齐国(0.031 04)**、巴东(0.031 17)**、新平(0.032 22)**、济南(0.032 74)**、犍为(0.033 36)**、日南(0.033 99)**、天水(0.034 21)**、江阳(0.034 58)**、弋阳(0.035 38)**、南乡(0.035 54)**、赵国(0.035 73)**、鲁郡(0.036 16)**、渤海(0.036 56)**、弘农(0.036 78)**、临海(0.037 48)**、谯郡(0.037 70)**、越巂(0.038 05)**、雁门(0.038 17)**、城阳(0.038 75)**、临川(0.039 69)**、渔阳(0.039 76)**、桂阳(0.039 93)**、汉嘉(0.039 99)**、代郡(0.040 02)**、西海(0.040 03)**、新兴(0.041 24)**、上谷(0.041 31)**、燕国(0.041 33)**、涪陵(0.042 25)**、中山(0.043 02)**、司州(0.043 05)**、临贺(0.043 28)**、高凉(0.043 29)**、永昌(0.043 60)**、抚夷(0.043 74)**、昌黎(0.044 79)**、任城(0.044 81)**、湘东(0.045 39)**、建平(0.046 00)**、敦煌(0.048 37)**、汶山(0.048 80)**、酒泉(0.049 61)**、阴平(0.051 59)**、郁林(0.052 71)**、右北平(0.053 61)**、济北(0.053 78)**、北地(0.057 07)**、建安(0.058 16)**、魏兴(0.058 18)**、广魏(0.058 79)**、辽西(0.059 31)**、梁国(0.060 67)**、合浦(0.060 74)**、蕲春(0.062 05)**、张掖(0.064 09)**、带方(0.068 15)* 、上庸(0.079 22)**、西河(0.115 80)**、玄菟(0.135 90)*

注:括号内数字为s值的平均值,*表示显著性〉95%,**表示显著性〉99%。

在纪传体具有不对称性优势(负值)的州郡体现为Sαβ为负值且衡量t统计的p值小于0.05。37个地域州郡包括了荆州、益州以及扬州的主要州郡,另外交州在所有州郡对的平均联系度中也具有突出的网络优势,尽管交州在INM算法中的点度低于青州和并州。
第二类是一般区位条件的州郡,Sαβ为负值在0值附近且衡量t统计的p值大于0.05。31个州郡包括幽州、并州、青州、雍州以及建业、下邳、蜀郡、京兆等州府所在地,与其他腹地州郡相比具有区位优势,但相比于三国交界的兵争要地来说,则区位优势不明显。
第三类是具有区位相对劣势的州郡,Sαβ为正值且衡量t统计的p值小于0.05。通过考察86个相对区位劣势的州郡,可以判断,在三国时期的地名呈现中,绝大部分的州郡处于依附性的外围。相对于Taylor采用多维尺度对城市体系的“核心—外围划分”,区位推荐算法的计算结果直接反映了相互之间边权的不对称性,克服了多维尺度度量方法中参数检验限制较大的弊端。采用统计方法对各个地域单元间联系的方向性判读,更加直接地反映了州郡地名呈现的极化效应。

4 讨论

地名关联的算法效度是地名共现的重要议题。为了检验LRM算法相对于传统共现网络计算的改进效果,研究隐匿原有州郡地名——纪传文本数据集的部分数据10次,按文本划分为训练集和预测集,共计10组数据,然后利用关联网络对隐匿数据的预测得分进行测试,通过与原有真实数据的比较以检测不同算法的效度。研究根据Lü[35]、Li[36]、Zhao[26]等的研究,计算均方根误差来衡量预测值与真实值的接近程度。均方根误差RMSE值越低,表明纪传体—地名词频关联的预测精度越高。基于二模网络的赋值定义与计算过程, 3个算法均包含了基于连锁模型的地域联系,在网络统计量方面体现为后两者对前者的改进,因此研究通过RMSE指数对3个算法进行比较,检测不同算法的效度。
在评价过程中,5%的样本信息用作预测集EP,其余95%的数据信息作为训练集ET。每次针对复现的预测集EP投影,训练集包含纪传体人物、州郡词频等已知信息,在此基础上预测或复现预测集的隐匿数据。根据Lü[35]和Li[36]提出的方法,对于EP集合中州郡α和纪传体 i的每一个潜在二模网络关联,当州郡α存在若干“邻居”州郡β(即州郡α与β存在地名共现),对于预测集内的任意隐匿州郡α频次而言,州郡α—纪传体 i的得分预测值 V α i P为:
V α i P = r α ¯ + β I α S α β · ( r β i - r β ¯ ) β I α S α β
研究评估消隐5%纪传体地名的预测词频情况,发现在10次随机测试中,如图12,分析每次测试的均方根误差(RMSE), LRM算法有9次的RMSE得分优于INM算法和DBCPF算法,表明基于LRM算法的空间网络复现更接近真实值。具体地,LRM算法产生的RMSE平均值为1.508,而INM算法的RMSE平均值为1.516,预测消隐地名词频的效度提高了5.5‰;胡定利[14]针对城市新闻词频联系对的归一化算法,DBCPF算法的均方根误差精度略逊于INM算法。总体上, LRM算法相对于INM算法、DBCPF算法的改进程度有限,但其均方根误差相对于其他算法有90%的概率处于较低水平,反映其地名词频复现效果的稳健性,且由LRM算法计算得到的关于边权不对称性的地域关联数据为判别区域体系的节点层级提供了统计依据。
图12 LRM、INM、DBC算法的均方根误差测试比较

Fig. 12 The comparison of Root Mean Square Error (RMSE) among the algorithm of LRM, INM and DBC

研究表明,LRM算法针对INM算法的改进对地点推荐效果的误差精度一般在1%~5%之间,LRM算法主要贡献是在理论模型方面实现了区域的非均衡联系,只不过《三国志》有限的纪传体文本数限制了本研究的效度。

5 结论

地名共现网络现有的算法计算结果忽略了每篇文本涉及的州郡地名个数以及各地名词频的影响,同时没有考虑到地域联系间的不对称性。对此,本文构建了一个新的地名共现测度方法——区位推荐算法(LRM算法),基于纪传体文本《三国志》州郡地名共现词频展开网络复现,从层级结构、地理分布特征进行探索性研究,并针对全书州郡网络及重要都城、州府的不对称分析进行制图研究。本文主要结论如下:
(1)LRM算法有效地对三国鼎立时期魏、蜀、吴地名共现网络进行演绎,发现该地域联系具有明显的层级特征和地理空间特征,该算法较为完整地反映了地名共现词频在地域联系中的社会网络特征。
(2)对比传统连锁模型算法(INM算法、DBCPF算法),LRM算法取得了更为稳健的复现效果(预测实验中与真实值比较,LRM算法产生的RMSE平均值为1.508,而INM算法的RMSE平均值为1.516),在预测消隐地名词频的效度提高了5.5‰。而在多次测试中,LRM有90%的概率呈现低水平的RMSE值,可见该算法的稳健性更高。
(3)LRM算法的优势之一是通过该算法可计算边权两端具有不对称特征的地域联系值,这是传统连锁模型算法不具备的特征。通过基于LRM算法和INM算法的制图结果对比,LRM算法计算结果展现出地域联系两端不同的粗细程度,直接提供了区位优势信息。
(4)LRM算法的另一优势是能够为判别区域体系的节点层级提供统计依据,并且基于LRM算法得到的边权不对称矩阵可分析各地共同作为人物事件活动频次的能级差异,具体通过非独立样本t检验分析,根据t检验的显著性水平划分地域单元在网络中的区位优势水平。相对于Taylor采用多维尺度对城市体系的“核心—外围划分”,LRM算法克服了多维尺度度量方法中参数检验限制较大的弊端,并且采用统计方法对各个地域单元间联系的方向性判读,更加直接地反映了州郡地名呈现的极化效应。
鉴于《三国志》是一部以军事、政治为主要记载内容的纪传体史书,主题相对集中,地名的时间特征弱化,因此本文未考虑不同主题[18]下以及较长时间跨度[37]的地名共现差异。Wang[38]已提出基于词典的分类方法对非结构化文本进行主题划分,对比按不同主题和按时间分类的地名共现数据检验该算法的可靠性将会是下一步的研究重点。另外,本文对于网络的形成机制更多集中于军事视角,仍有史料不足的局限。本文将改进的共现方法应用于史书进行地域网络复现,延展了共现网络的研究视角。研究结果并非试图替代其他网络复现方法,而应该视之为一种补充。后续需要对不同语义类型的数据和具体的经济、交通数据等耦合分析,在此基础上对算法进行归纳性的改进。以本文模拟对象为例,倘若获得三国时期战役数据、军资运输量或经济贸易量等更为直接的数据,则可以做更为直接的网络联系,且本文模拟结果应视为一种辅助性分析。
[1]
王妮满, 秦昆, 罗俊, 等. 历史名人轨迹的空间可视化与分析[J]. 地球信息科学学报, 2020, 22(5):978-988.

DOI

[Wang N M, Qin K, Luo J, et al. Spatial visualization and analysis of trajectories of historical celebrities[J]. Journal of Geo-Information Science, 2020, 22(5):978-988.] DOI:10.12082/dqxxkx.2020.190770

DOI

[2]
武洋. 第二次世界大战期间英国反情报工作研究[D]. 长沙: 国防科技大学, 2020.

[ Wu Y. On British counterintelligence in the second world war[D]. Changsha: National University of Defense Technology, 2020.]

[3]
赵耀龙, 巢子豪. 历史GIS的研究现状和发展趋势[J]. 地球信息科学学报, 2020, 22(5):929-944.

DOI

[Zhao Y L, Chao Z H. A review of historical GIS and its trend[J]. Journal of Geo-Information Science, 2020, 22(5):929-944.] DOI: 10.12082/dqxxkx.2020.190732

DOI

[4]
张雪英, 张春菊, 闾国年. 地理命名实体分类体系的设计与应用分析[J]. 地球信息科学学报, 2010, 12(2):2220-2227.

[ Zhang X Y, Zhang C J, Lv G N. Design and analysis of a classification scheme of geographical named entities[J]. Journal of Geo-Information Science, 2010, 12(2):2220-2227.]

[5]
Griffin L J. Narrative, event-structure analysis, and causal interpretation in historical sociology[J]. American Journal of Sociology, 1993, 98(5):1094-1133. DOI:10.1086/230140

DOI

[6]
Taylor P J, Hoyler M, Evans D M. A geohistorical study of ‘the rise of modern science’: Mapping scientific practice through urban networks, 1500-1900[J]. Minerva, 2008, 46(4):391-410. DOI:10.1007/s11024-008-9109-8

DOI

[7]
Raja R, Sindbæk S M. Urban network evolutions: towards a high-definition archaeology[M]. Aarhus: Aarhus University Press, 2018.

[8]
Tobler W, Wineburg S. A Cappadocian speculation[J]. Nature, 1971, 231(5297):39-41. DOI:10.1038/231039a0

DOI

[9]
Tobler W R. A computer movie simulating urban growth in the Detroit region[J]. Economic Geography, 1970, 46(sup1):234-240. DOI:10.2307/143141

DOI

[10]
Jean G. Megalopolis: The urbanized north-eastern seaboard of the United States[M]. Cambridge MA: MIT Press, 1961.

[11]
Pred A. Urban growth and the circulation of information:The United States system of cities, 1790-1840[M]. Cambridge: Harvard University Press, 1973

[12]
Zhao M X, Tang Z L. Local network research of the Yangtze River Delta based on economic news[J]. GaWc research bulletins, 312(B), 2010. https://www.lboro.ac.uk/microsites/geography/gawc/rb/rb312.html

[13]
Liu Y, Wang F H, Kang C G, et al. Analyzing relatedness by toponym co-occurrences on web pages[J]. Transactions in GIS, 2014, 18(1):89-107. DOI:10.1111/tgis.12023

DOI

[14]
蒙文清, 尹章才. 基于地名互现的城市联系强度研究——以湖北省为例[J]. 测绘地理信息, 2020, 45(2):31-34.

[ Meng W Q, Yin Z C. A study on the strength of urban connection based on toponym co-occurrences: A case study of Hubei Province[J]. Journal of Geomatics, 2020, 45(2):31-34.] DOI:10.14188/j.2095-6045.2018268

DOI

[15]
胡定利, 李锐, 孟瑶, 等. 新闻地名共现视角下的中国城市网络[J]. 武汉大学学报·信息科学版, 2020, 45(2):281-288.

[Hu D L, Li R, Meng Y, et al. China's urban network from the perspective of toponym co-occurrences in the news[J]. Geomatics and Information Science of Wuhan University, 2020, 45(2):281-288.] DOI:10.13203/j.whugis20180383

DOI

[16]
Zhong X, Liu J J, Gao Y, et al. Analysis of co-occurrence toponyms in web pages based on complex networks[J]. Physica A: Statistical Mechanics and Its Applications, 2017, 466:462-475. DOI:10.1016/j.physa.2016.09.024

DOI

[17]
龚致嘉. 基于新闻文本信息的城市关联网络分析[D]. 北京: 中国地质大学(北京), 2021.

[ Gong Z J. City relatedness network analysis based on news articles[D]. Beijing: China University of Geosciences, 2021.] DOI:10.27493/d.cnki.gzdzy.2021.000588

DOI

[18]
Peng H, Du Y Y, Liu Z, et al. Uncovering patterns of ties among regions within metropolitan areas using data from mobile phones and online mass media[J]. GeoJournal, 2019, 84(3):685-701. DOI:10.1007/s10708-018-9885-0

DOI

[19]
Salvini M M, Fabrikant S I. Spatialization of user-generated content to uncover the multirelational world city network[J]. Environment and Planning B: Planning and Design, 2016, 43(1):228-248. DOI:10.1177/0265813515603868

DOI

[20]
Hu Y J, Ye X Y, Shaw S L. Extracting and analyzing semantic relatedness between cities using news articles[J]. International Journal of Geographical Information Science, 2017, 31(12):2427-2451. DOI:10.1080/13658816.2017.1367797

DOI

[21]
Meijers E, Peris A. Using toponym co-occurrences to measure relationships between places: Review, application and evaluation[J]. International Journal of Urban Sciences, 2019, 23(2):246-268. DOI:10.1080/12265934.2018.1497526

DOI

[22]
Spitz A, Geiß J, Gertz M. So far away and yet so close: Augmenting toponym disambiguation and similarity with text-based networks[C]// Proceedings of the Third International ACM SIGMOD Workshop on Managing and Mining Enriched Geo-Spatial Data. New York: ACM, 2016:1-6. DOI:10.1145/2948649.2948651

DOI

[23]
Sassen S. The global city:New York, London, Tokyo[M]. Princeton, NJ: Princeton University Press, 1991.

[24]
Taylor P J. Specification of the world city network[J]. Geographical Analysis, 2010, 33(2):181-194. DOI:10.1111/j.1538-4632.2001.tb00443.x

DOI

[25]
Zhou T, Ren J, Medo M, et al. Bipartite network projection and personal recommendation[J]. Physical Review E, Statistical, Nonlinear, and Soft Matter Physics, 2007, 76(4 Pt 2):046115. DOI:10.1103/PhysRevE.76.046115

DOI

[26]
Zhao M X, Derudder B, Zhang P C, et al. An expanded bipartite network projection algorithm for measuring cities' connections in service firm networks[J]. Networks and Spatial Economics, 2020, 20(2):479-498. DOI:10.1007/s11067-019-09486-1

DOI

[27]
晋陈寿撰, 宋裴松之注. 三国志[M]. 北京: 中华书局, 1999.

[ Chen S, Pei S. The history of the three kingdoms[M]. Beijing: Zhong Hua Book Company, 1999.]

[28]
谭其骧. 简明中国历史地图集[M]. 北京: 中国地图出版社, 1991.

[ Tan Q X. Consise Historical Atlas of China[M]. Beijing: Sino Maps Press, 1991.]

[29]
Jiang B. Geospatial analysis requires a different way of thinking: The problem of spatial heterogeneity[J]. GeoJournal, 2015, 80(1):1-13. DOI:10.1007/s10708-014-9537-y

DOI

[30]
Scripter M W. Nested-means map classes for statistical maps[J]. Annals of the Association of American Geographers, 1970, 60(2):385-392. DOI:10.1111/j.1467-8306.1970.tb00727.x

DOI

[31]
Jiang B. Head/tail breaks: A new classification scheme for data with a heavy-tailed distribution[J]. The Professional Geographer, 2013, 65(3):482-494. DOI:10.1080/00330124.2012.700499

DOI

[32]
宋杰. 三国兵争要地与攻守战略研究[M]. 北京: 中华书局, 2019.

[ Song J. Research on the defensive and offensive strategy for military places of the three Kingdoms[M]. Beijing: Zhonghua Book Company, 2019.]

[33]
张兴照. 孙吴“限江自保”国策刍议[J]. 湖北文理学院学报, 2016, 37(04):10-14.

[ Zhang X Z. Self- defence with the Changjiang River: The Kingdom of Wu's national policy[J]. Journal of Hubei University of Arts and Science, 2016, 37(04):10-14.]

[34]
陈健梅. 从政区建置看吴国在长江沿线的攻防策略——以吴、魏对峙为背景的考察[J]. 中国史研究, 2010(1):71-85.

[ Chen J M. On Wu's offensive and defensive strategies along the Yangtze River from the perspective of the establishment of political districts——Based on the confrontation between Wu and Wei[J]. Journal of Chinese Historical Studies, 2010(1):71-85.]

[35]
L Y, Medo M, Yeung C H, et al. Recommender systems[J]. Physics Reports, 2012, 519(1):1-49. DOI: 10.1016/j.physrep.2012.02.006

DOI

[36]
Li Z D, Luo Q, Shi L L. Weighted bipartite network recommendation algorithm based on increasing similarity coefficient[J]. Computer Science, 2016, 43(7):259-264.

[37]
Yuan Y H. Modeling inter-country connection from geotagged news reports: A time-series analysis[M]// Data Mining and Big Data. Cham: Springer International Publishing, 2017:183-190. DOI:10.1007/978-3-319-61845-6_19

DOI

[38]
Wang T J, Meijers E, Wang H J. The multiplex relations between cities: A lexicon-based approach to detect urban systems[J]. Regional Studies, 2022:1-13. DOI:10.1080/00343404.2022.2120978

DOI

文章导航

/