新时代地图的机遇与挑战

新一代人工智能驱动下地图学研究的机遇与挑战

  • 张岸 , 1, 2, * ,
  • 朱俊锴 1, 2
展开
  • 1.中国科学院地理科学与资源研究所 资源与环境信息系统国家重点实验室,北京 100101
  • 2.中国科学院大学,北京 100049

张 岸(1982— ),男,湖南岳阳人,博士,副研究员,主要从事专题地图与地学信息图谱研究。E-mail:

Copy editor: 蒋树芳

收稿日期: 2024-01-03

  修回日期: 2024-01-15

  网络出版日期: 2024-03-26

基金资助

中国科学院战略性先导科技专项项目(XDB0740100)

国家重点研发计划项目(2022YFC3002804)

Opportunities and Challenges of Cartography Research Driven by New Generation Artificial Intelligence

  • ZHANG An , 1, 2, * ,
  • ZHU Junkai 1, 2
Expand
  • 1. State Key Laboratory of Resources and Environmental Information System, Institute of Geographical Sciences and Natural Resources Research, Chinese Academy of Sciences, Beijing 100101, China
  • 2. University of Chinese Academy of Sciences, Beijing 100049, China
* ZHANG An, E-mail:

Received date: 2024-01-03

  Revised date: 2024-01-15

  Online published: 2024-03-26

Supported by

Strategic Priority Research Program of the Chinese Academy of Sciences(XDB0740100)

National Key Research and Development Program of China(2022YFC3002804)

摘要

随着生成式人工智能(AIGC)为代表的新一代人工智能的快速发展,加速了各个学科转向人工智能驱动的科学研究,地理空间智能(GeoAI)技术在解决传统制图学任务注定会比传统的方法具有更好的性能,地图学也因此迎来了新的机遇与挑战,产生智能地图制图新领域,形成智能地图制图学。地图学研究有人工智能传统,但是过去受限于人工智能工具的计算能力等原因,并未取得很大的进展。随着进入智能化时代,人与机器都将成为制图与读图的主体。地图内容的产生经历了专家生成内容和用户生成内容的阶段,正在向人工智能生成内容阶段发展。人工智能与地图传输模型的结合衍生出智能地图传输模型,包括制图信息智能获取、智能制图、智能读图、地图信息智能解读4个环节,进而从这4个方面对智能地图的研究进展进行了分析和梳理。研究显示,使用智能化方法解决地图学问题的研究仍然处于起步阶段,人工智能与地图学结合仍存在诸多挑战,包括缺乏训练数据集、模型算法缺乏泛化能力和可解释性等,这些也是未来可以发展的方向。

本文引用格式

张岸 , 朱俊锴 . 新一代人工智能驱动下地图学研究的机遇与挑战[J]. 地球信息科学学报, 2024 , 26(1) : 35 -45 . DOI: 10.12082/dqxxkx.2024.240128

Abstract

As Artificial Intelligence Generated Content(AIGC) rapidly advances, various disciplines are shifting toward AI-driven scientific research. GeoAI technology, which focuses on geographic spatial intelligence, has the potential to outperform traditional methods in solving cartographic tasks. This shift presents both new opportunities and challenges for cartography. Despite some progress in integrating AI into cartographic research, limitations in computational power and other factors have hindered significant success in the past. As we enter the era of intelligence, both humans and machines will play critical roles in map creation and interpretation. Through artificial intelligence algorithms, maps can be produced quickly, at low cost, and on a large scale. However, there are also issues such as the instability of the quality of map works. The generation of map content has gone through the stages of expert-generated content and user-generated content and is developing towards the stage of artificial intelligence-generated content. In the traditional map-making phase, professional maps are produced by cartographic experts. While the quality of these maps is assured, the number of experts is limited. Consequently, the production cycle is long, the cost is high, the quantity of map products is limited, and they have not been produced on a large scale. At the current stage, generative artificial intelligence can produce map content in three forms: text-to-map (txt2map), map-to-text explanation (map2txt), and map style transfer (map2map). People can already use ChatGPT to generate maps by entering a piece of text, produce a textual explanation of a map by uploading an image of the map to ChatGPT, and even achieve map style transfer from images using Generative Adversarial Networks (GANs). The integration of artificial intelligence with the map transmission model has derived an intelligent map transmission model. It includes four stages: (1) Intelligent acquisition of mapping information: Sampling and collecting information about the real-world geographical environment through artificial intelligence methods, which is then processed and filtered into structured information for mapping; (2) Intelligent mapping: The process of intelligently generating maps through the use of colors, symbols, grading, and other representational methods based on mapping information; (3) Intelligent map reading: The process by which readers use artificial intelligence methods, combined with map language, domain knowledge, and personal understanding, to recognize the real world; (4) Intelligent interpretation of map information: Using artificial intelligence to interpret maps, thereby gaining cognition and understanding of the real world. Although progress has been made, research on using intelligent methods to address cartographic challenges is still in its early stages. Challenges include the lack of comprehensive training datasets, limited model algorithm generalization, and interpretability. These areas offer promising directions for future development.

1 引言

地图既是地球空间信息的可视化形式和人类空间形象思维的表现,也是空间信息传输与认知的重要手段,随着时代的发展,地图学也面临着诸多的机遇与挑战[1]。地图以科学的符号系统、地图投影和综合方法表达复杂地理世界的空间结构和空间关系,移动互联网络、传感网、物联网和智能移动终端的飞速发展使得信息内容更丰富、获取形式更多样,人与人、人与物、物与物之间按需进行信息获取、传递、存储、认知、决策等功能的地图新形式已经来临[2]。信息与通信技术的快速发展带动人类进入地理空间、人文社会空间和信息空间相融合的三元空间,地图制图的目的、人员、对象和环境等均发生巨大变化,地图的类型、空间对象、表达维度、地图角色等呈现出显著泛化特征,现有地图学理论无法引领和指导当代的地图实践[3]
生成式人工智能(AIGC)模型代表的新一轮人工智能技术浪潮正推动人类社会全面变革,受到了学术界、工业界和大众的广泛关注。以GPT-3[4]和GPT-4[5]等为代表的大型语言模型(LLM)、Stable Diffusion[6]为代表的文本转图像模型的发展,加速了人工智能研发。各个学科的科学研究范式也正加速转换,越来越多的学者也转向人工智能驱动的科学研究(AI for science)[7]。通过机器学习,特别是深度学习,人工智能为计算机视觉、自然语言处理等一系列具有巨大挑战性的问题提供了很好的解决方案[8]。对于地理学而言,地理空间领域的智能化发展和研究迎来了新的机遇和挑战[9]。地理空间科学与人工智能相交叉形成了地理空间人工智能(GeoAI)的研究方向,目前已经在空间表征学习、时空预测和空间插值、对地资源环境监测、地图学、地理文本语义分析等方面开展应用[10]。地图学与人工智能交叉融合,产生智能地图制图新领域,形成智能地图制图学[11]。正如陈述彭院士所说“地图是永生的,作为人类的一种文化工具,地学的第二语言,决不会由于数字化、电子化反而无所作为[12]。”人工智能时代的到来给地图学的下一个辉煌提供了难得的历史转机,同时也提出了严峻挑战[11]
在这一研究背景下,本文针对近期AIGC驱动下智能地图制图学研究一些进展,从制图信息获取、制图综合、制图流程、地图风格迁移、地图阅读等方面对地图学当前研究的机遇与挑战开展分析和讨论。

2 人工智能在地图学中的发展

2.1 地图学研究的人工智能传统

人工智能是指在机器中模拟人类智能,其发展可以追溯到20世纪50年代,经历了多次发展与兴衰。2011年以后进入了深度学习和大数据发展时期,大多数的深度学习模型都是基于人工神经网络(ANN)发展起来的,例如卷积神经网络(CNN)、对抗神经网络(GAN)等。自2020以来又进入了AI时代和生成人工智能时期,transformer构架的大语言模型不断涌现[13]
人工智能技术应用在制图领域并非一个新话题,吴忠性[14]就认为地图学的发展可分为三大阶段:第一个阶段是建立现代地图学的科学体系;第二个阶段是出现了计算机辅助制图;第三个阶段将人工智能与专家系统应用到制图领域。早在20世纪80至90年代,国内外学者就开始探讨人工智能在地图学中的应用。Buttenfield[15]通过研究图形和地图空间中的线状要素结构特征,提出了使用计算机制图和人工智能技术进行制图综合;Fisher等[16]探讨了地图制图专家系统的可能性和发展前景;Johnson等[17]提出了使用专家系统来帮助地图标注在地图上的放置,并用神经网络技术来补充协助创建地图标注放置的规则。地图制图专家系统一度成为人工智能与地图学结合领域中的热点问题,是人工智能在地图学研究中最接近实用、最为活跃的研究领域之一[18]。王家耀[19]提出了制图综合专家系统的设计思想与系统构成,系统外壳的实现等。专家系统在地图制图领域中,广泛用于地图设计和生产[20]、矢量和栅格制图要素的自动提取[18]、地图投影选择[21]、地图要素表示等级确定[22]、地图要素的自动制图综合[15,23]等。专家系统的实现难度在于首先需要收集地图专家的知识经验,总结成可供计算机使用的知识库的形式(例如决策树),然后需要为计算机系统设计一套推理的流程。在许多时候,地图学中的知识无法通过简单的IF语句、决策树或数学公式表达,这就导致了针对某些制图学问题的知识库难以构建和推理流程难以构建,这是专家系统未能取得突破性成功的重要原因之一。总而言之,早期研究专注于使用人工智能方法应用到传统的地图学任务中,尝试实现部分制图过程的自动化。

2.2 地图内容生产的智能化发展

内容生产的发展通常可以分为3个阶段:专家生成内容(Professionally Generated Content, PGC)、用户生成内容(User Generated Content, UGC)、及 AI生成内容(AI Generated Content, AIGC),地图内容从产生模式同样也可以分为: PGC地图阶段、UGC地图阶段、AIGC地图阶段(表1)。
表1 地图内容生产模式的发展特征

Tab. 1 Development feature of map content generation modes

阶段 特点 创作主体 规模 效率 质量 成本
PGC地图 专家生成内容 地图专家 生成慢
UGC地图 用户生成内容 用户 生成快
AIGC地图 人工智能生成内容 人+机器 生成快 不稳定
PGC地图阶段:即传统的地图编制阶段,是由地图专家制作生成专业地图的过程,虽然这些地图的质量得到了保证,但毕竟地图专家数量有限,这些地图生产的周期长、成本高,地图产品的数量也有限,并未形成规模。此外,由于专业地图的创作者是地图专家,而地图用户是被动的使用者,只能在有限的选择范围内获得信息,并未形成制图者和读图者之间良好的互动关系。
UGC地图阶段:随着互联网的兴起,地图的制作变得容易,普通大众也可以制作地图,拉低了地图制作的专业门槛,各类用户产生的地图涌现,虽然地图作品生成快、成本低,但是由于用户水平层次不齐也造成地图创作内容质量不能得到保证。
AIGC地图阶段:进入智能化时代,人与机器都将成为制图与读图的主体,通过人工智能算法,能够快速地、低成本、大规模的生成地图作品,但是也存在地图作品质量不稳定等问题。
总的来说,目前地图内容的产生仍处于专家生成内容和用户生成内容的阶段为主,正在向人工智能生成内容阶段发展。
生成式人工智能新技术的发展为地图学带来了新的机遇与挑战。生成式人工智能在现阶段可以通过3种形式产生地图内容,分别是文本生成地图(txt2map)、地图生成解释(map2txt)、地图风格迁移(map2map)。人们已经可以使用ChatGPT通过输入一段文字来生成地图,也可以通过ChatGPT上传一副地图的图片来产生一幅地图的文字解释,甚至还可以用对抗生成网络(GAN)从图片实现地图风格的迁移。如图1(a)所示,笔者通过ChatGPT生成的一副北京地图,图1(b)则为一副地图的解释, 图1(c)则为地图风格迁移的示例。很显然由于这些功能并非针对地图,而是针对图像数据的所设计和研发,尽管借助人工智能方法或工具已经可以在一定程度上完成地图生成和地图解释,但目前AI生成的地图所生成的地图虽然快速但是较为随机且不稳定,并非像地图那样是真实世界的映射;AI读图做出的解释缺乏上下文信息和针对性;地图风格的迁移更像艺术地图,而非科学地图,缺乏实用性。此外,目前基于AI的智能读图和智能制图大部分是黑箱模型,人们无法对其机理进行解释和说明。
图1 文本生成地图、地图生成解释和地图风格迁移示例

Fig. 1 Examples of text-to-map, map-to-explanation and map style transfer

针对这些问题,学术界也开展了广泛讨论。艾廷华等[24]认为目前深度学习+地图制图的结合面临诸多挑战,包括:地图数据组织的非规范性、样本建立的专业需求、几何与地理特征的融合,以及地图固有的空间尺度性。任福等[25]深入讨论智能制图显性和隐性知识表征,提出建立地图知识图谱的构想,总结了基于低代码技术的智能地图制图平台开发范式。Kang等[26]认为基于机器学习和深度学习算法的GeoAI技术在解决传统制图学任务可能会比传统的方法取得更好的性能。例如,基于GeoAI的方法在识别和检测地图中的地理对象[27-29]的表现更好,这些主题一般被归类为地图学中的数据处理部分或者地图信息获取部分。除此之外,最近人工智能的突破在地图的艺术性方面取得了巨大的成功,例如地图风格的迁移和转换[30-31],这部分内容被认为是凝聚着地图学创造力和经验的部分,现在可以部分被GeoAI技术代替。

3 地图传输模型的智能化发展

3.1 地图传输模型

地图的制作和应用是地图学的2个核心问题和任务。地图传输模型(Map Communication Model)借鉴了信息论的观点,描述了地图信息的创造和传播的整个过程,把地图视为一种交流工具,以优化地图的效率[32]。地图作为传输方式的思想是Keates在1964年在伦敦的会议上引入的[33],但最早的地图传输模型是由Moles在1964年所设计[34],对地图传输模型发展最有影响力的早期贡献是由Koláčný[35]在1969年提出, Koláčný以制图者对现实有选择性的观察为模型的起点,通过地图符号的语言,实现了现实多维知识模型向地图信息的转化,这些信息被读图者读取并理解,形成对现实世界的认知,整个地图传输模型的过程的核心概念是地图信息的传递[36]。总而言之,地图传输模型描述了制图者把对客观世界的认识加以选择、分类、简化等信息加工并经过符号化,通过地图传递给用图者,用图者经过符号识别,同时通过对地图的分析和解译形成对客观世界的认识的过程[36]
Brassel等[37]很早就提出了一种地图自动生成的理论框架,他们认为,在未来的高级制图综合工作中有两大主线,分别是为理解地图的结构提供理论基础和关注地图综合背后的数据模型。前者通过关注地图使用中“地图理解”的理论,为地图制作提供启发;后者则是直接关注数字制图中遇到的数据模型问题。与20世纪60年代和70年代的地图制作过程相比,今天的地图学在制图者与地图之间以及地图与用户之间都显得更有交互性。随着数字制图的发展,今天的地图制作和编辑过程对用户和制图者的审美判断更加敏感[32],审美也不足以区分专业制图人员和业余人员。换言之,制图学的门槛在新兴数字制图工具的引领下降低了,也使制图效率得以提高。除此之外,许多新型地图产品也陆续出现,如多媒体地图、三维地图、增强现实地图等,这些产品区别于传统意义上的地图。总而言之,数字时代的发展和数字地图的出现改变了传统的地图学的范式,传统的地图传输模型各个环节的内涵也发生了重大改变。因此,需要提出一种新的地图传输模型来适应数字化时代[38]

3.2 智能地图传输模型

随着地图学的发展已经进入了智能化时代,人工智能可以在地图传输模型的各个环节结合,这些结合也是地图学未来智能化发展的方向。在传统的地图传输模型中,制图和读图的主体都是人。在经历了传统地图时代、数字地图时代后,人与机器共同成为制图的主体。进入智能化时代,人与机器都将成为制图与读图的主体,智能制图与智能读图应运而生。Koláčný所提出的经典地图传输模型在AI的加持下衍生为智能地图传输模型,如图2所示,包括4个环节: ① 制图信息智能获取:通过人工智能方法采样、收集现实世界地理环境的信息,经过加工、筛选成结构化的用于制图的信息; ② 智能制图:制图信息通过色彩、符号、分级等表示方法智能生成地图的过程; ③ 智能读图:读图者利用人工智能方法,结合地图语言、领域知识和个人理解对现实世界认识的过程; ④ 地图信息智能解读:利用人工智能对地图做出解释,从而获得对现实世界的认知和理解。
图2 智能地图传输模型

Fig. 2 Intelligent map communication model

3.3 AI与地图的应用结合模式

人工智能方法以“AI+地图”的模式与地图应用开展结合。AI辅助制图数据的获取,极大的丰富了数据源,帮助制图者快速的获取大量制图数据。如图3所示, AI辅助制图流程,加速制图的流程,以智能制图环节为例,制图综合是制图学中的传统任务,过去严重依赖于知识和经验,而人工智能模型(如深度卷积神经网络)可以帮助解决一部分制图综合任务。风格迁移则是计算机视觉和图形学兴起后流行的一种技术,通过将一个图像的内容与另一个图像的风格相结合来生成新图像,学者们把风格迁移应用于地图图像上,从而催生了地图风格迁移(map style transfer)。AI辅助读图则通过地图文本提取、符号识别、内容识别等方式增强对地图的理解。由此可见,人工智能技术改变了传统地图学的制图和读图的方式方法,还催生了新的制图和读图领域。
图3 人工智能方法与地图的应用结合

Fig. 3 Integration of artificial intelligence methods with cartography applications

4 智能地图制图学的研究进展

4.1 制图智能信息获取

进入智能化时代,我们可以更加便捷和高效地利用地理空间智能方法从现实世界采样和提取更加精确的信息。目前,制图信息获取智能化实现主要体现在遥感图像的目标检测[39]、地理大数据挖掘[40]等方面。
近年来,许多基于深度学习的目标检测方法的方法被提出,这些方法显著提高了目标检测的速率和准确度。一般来说,现有的用于目标检测的深度学习方法可以根据是否生成候选区域分为两种类型,分别是基于区域建议(region-proposal-based)的方法和基于回归(regression-based)的方法[41]。很多研究小组开发了对地观测的图像数据集(例如RSOD[42]、DOTA[43]、DIOR[41]等),人们使用可以这些公开的数据集来提取特定的地物,这意味着图像中额外的信息被发现了,人们不需要通过先验知识和经验来推断一幅图像的内涵。这些结果在一定条件下,也可以作为制图的数据来源。深度学习技术已经被用于卫星图像解译[44]、卫星图像分析[45-46]等任务。一些过去无法想象的全球尺度制图数据获取,如全球的树木检测[47]、全球的建筑制图[48]成为可能。人们还利用深度学习从其他来源的地理空间图像提取信息,例如街景照片[49]、扫描历史地图[50]、情绪制图[51]等。此外基于某种移动设备(如机器人、无人机、手机等)的SLAM(Simultaneously Localization and Mapping)技术可以实现从一个未知环境里的未知地点出发,在运动过程中通过传感器(如激光雷达、摄像头等)观测定位自身位置、姿态、运动轨迹,再根据自身位置进行增量式的地图构建,从而达到同时定位和地图构建的目的[52]

4.2 智能制图

众多研究者对智能制图的理论和方法进行了广泛的探讨,包括:地图风格迁移(map style transfer)[30-31,53]、使用ChatGPT等人工智能工具制图[54-55]、制图综合[56-57]等。
随着生成对抗网络(GAN)模型在图像领域风格迁移的广泛应用,地图的风格迁移也成为当前的研究热点,国内外学者开展了大量研究。Kang等[30]使用了2个GAN模型(Pix2Pix和CycleGAN)从Google Maps、OpenStreetMap和艺术绘画中识别风格,并迁移于未渲染的矢量数据中,随后对地图风格迁移的效果进行了评估。韩杨丽和吴明光[58]使用了基于流形学习的地图颜色自动转移方法,构建了顾及地图颜色设计科学性与艺术性的地图颜色转移模型,并在颜色流形基础上引用人工蜂群启发式搜索算法来解决约束搜索问题,实现了模型的快速求解。地图风格迁移在实现风格转换方面效果显著,但现有的风格迁移大多为栅格的迁移,在地图细节上经常出错。除了栅格形式地图的风格迁移,吴明光等[59]比较了矢量和栅格的地图风格迁移,认为基于栅格的迁移方法很难解析出地图内容和制图规则,容易出现内容不一致的问题,地图可读性较低;基于矢量的迁移方法可以嵌入制图知识规则来区分要素内容,风格迁移结果可读性较高。Kang等[60]认为基于栅格的地图风格迁移有着固有的缺陷:生成的地图输出可能具有模糊的区域和不明确的地图符号和地名,可能会删除视觉上不重要但语义上重要的特征。现有的大多数关于地图风格的研究都是基于栅格数据的,因此基于矢量的风格迁移方法在未来可能会有更大的应用空间。
自ChatGPT等大语言模型(Large Language Models, LLM)问世以来,人们对于人工智能平台的关注日渐增加,许多地图学家也尝试将它们用于制图实践。例如,Tao等[54]探讨了利用ChatGPT制作地图的可能性。在制作地图的整个流程中,通过与ChatGPT交互,输入提示词(prompt),驱动其使用读取地理空间数据并绘制最终地图,ChatGPT生成一段绘制地图的代码和简短的描述,制图者运行这段代码就可以完成地图的绘制。使用ChatGPT制图的好处是,降低了制作地图的门槛、提高了制作地图的效率,而且可以启发制图者对地图的设计。但是,这种制图方法仍然存在一定的缺陷。例如,Chat GPT的回答具有一定的随机性;初次生成的地图一般都不尽如人意,绘制一幅令人满意的地图需要根据绘图者的进一步提示进行多次迭代;有时候ChatGPT无法给出完美的回答,需要绘图者对它的代码进行调整,这对于缺乏一定知识或技能的绘图者可能是很大的挑战。因此,ChatGPT等人工智能工具受限于数据源、回答的形式和随机性等原因,只能够完成制图的一部分工作,更多的是以助手的身份帮助制图者完成制图任务。
智能化的地图综合取得突破[11],Feng等[56]将DCNNs(深度卷积神经网络)用于制图综合任务,特别是建筑物的制图综合任务中,具体对U-net、残差U-net和GAN 3种网络架构进行了评估,在 1:100 00、1:150 00和1:250 00 共3种比例尺的情况下并对模型性能进行了比较。
从上述进展不难发现,目前已有的研究涵盖了制图综合、使用人工智能工具辅助制图等制图环节,但目前还无法使用智能方法构建完整的制图流程。

4.3 智能读图

地图读图和解读通常包括阅读地图并确定地图所描绘的内容以及制图者如何制图的过程,这包括识别描绘地理对象的特征、现象、使用的符号和标签,甚至包括不在地图中显式表达的地图信息[61]。Kang等[60]认为地图阅读(map reading)、地图解释(map interpretation)和地图分析(map analysis)都是地理空间智能的重要发展方向,是地图读图和解读的3个层面。基于地理空间智能的地图阅读方法可以从输入的地图集中识别和确定特征位置、标签和符号属性,具体而言包括对象提取和本体构建等任务。地图解释是指通过人类认知来解释地图特征及其在世界上的对应特征之间的关系[61],是地图阅读的进一步延伸。例如,描述和推断一幅地图的空间位置和空间范围。地图分析是指在地图阅读和地图解释之后对地图进行的分析推理。目前,关于使用地理空间智能进行地图解读的研究主要集中在地图阅读和地图解释方面,关于使用地理空间智能分析地图的研究很少。
杨启和等[62]很早就提出地图模式识别的概念,通过地图模式识别使计算机实现人对地图的阅读和理解,采用机器模拟人类视觉系统,模拟人脑对视觉信息的分析判决过程。周熙然等[63]从地图内容提取与识别、地图语义分析两个层次,探讨了支持泛源地图图像大数据识别的理论与技术框架。这个框架首先定义了既能够表达地图图像内容,又能够为模型或算法学习和表征的地图特征;其次构建面向泛源、多样、复杂地图图像特征的检测与地图图像内容的识别方法;然后再构建地图图像潜在语义与隐含知识的挖掘方法,实现地图图像理解。Li等[64]提出了一种地名信息的智能地图阅读方法,该框架将深度学习技术和地名录相结合,对地图的内容进行自动准确的理解。这个框架通过深度学习方法检测地图文本,基于图形的分割和聚类分离文本单元,使用OCR引擎进行字符识别,实现基于数字地名录的地图内容理解。

4.4 地图信息智能解读

目前地图信息智能解读的研究较少,缺乏关于地图智能分析的研究。虽然目前通用的人工智能工具(如ChatGPT)来解读地图已经可行,但缺乏专业性和针对性,很难对地图进行深层次的理解。目前的地图信息智能解读研究,主要围绕地图信息增强、地图问答系统的。Hu等[65]提出了一种基于深度学习方法来增强地图图像信息的方法,通过添加从地图图像中提取的空间范围和地名来丰富地图图像的元数据,从而增强了地图的可用性和地图图像信息的丰富性。
在地图问答系统方面,Chang等[66]建立MapQA数据集,包含了大约80万对问答和6万张图像的数据集,进而基于MapQA数据库提出了基于问答的视觉多输出数据提取算法(V-MODEQA),这种算法通过多输出模型从地图图像中提取底层结构化数据,然后进行推理,能够回答一些简单的地图问答。Chang等[66]不仅开发了一种提取和推理数据的算法,并且提供了一个样本量足够大的数据库,这为后人继续进行地图解读的工作提供了数据基础。

5 总结与展望

总的来说,随着新一代人工智能时代的到来,尤其是生成式人工智能的发展,为地图学的发展迎来了新机遇。进入智能化时代,人与机器都将成为制图与读图的主体,但同时也存在诸多挑战。总的来说,目前使用智能化方法解决地图学问题的研究仍然处于起步阶段。还存在以下不足:
(1) 缺乏可用于智能地图制图学研究的训练数据集。目前无论是通过人工智能算法自动制图产生的地图,还是读图产生的解释文字,或是风格迁移产生的风格地图,看上去“智能”产生内容往往都不能使用,更像天马行空的艺术作品创作,而非科学严谨的专业地图成果。主要原因无论是目前的大语言模型还是视觉模型,都是基于通用语料库和图像库,缺乏针对制图规则、地图领域知识的语料库,缺乏专门的地图训练数据集,造成了目前智能地图的效果并不理想。
(2) 目前智能地图制图学的模型算法缺乏泛化能力。智能地图模型算法不光要在训练集上表现良好,还要能够在先前未观测的新数据上表现良好。一方面,增加数据样本可以提高模型的泛化能力,可以通过数据增强、迁移学习、集成学习等技术来扩充数据集。另一方面,需要研究如何把制图经验和地学领域知识转变为逻辑推理,如何利用智能方法组件一套自动制图流程和可视化规则。已有的研究涵盖了视觉变量选取、制图综合、使用人工智能工具辅助制图等制图环节,但缺少研究使用智能方法构建整套制图流程。
(3) 目前的智能地图制图学的生成内容缺乏可解释性。目前大部分的大语言模型和视觉模型都是人工智能“黑盒”模型,虽然可以实现从文字来生成地图,也可以由地图来自动产生文字解释,甚至还可以从图片实现地图风格的迁移,但目前的生成内容普遍存在不确定性和偶然性,缺乏科学解释,缺乏上下文信息和针对性。因此需要发展可解释、可扩展、可信赖、安全可靠的智能地图模型算法。
人工智能工具的出现推进了地图学的智能化进步,使得绘制一幅地图的门槛和成本大大降低。尽管人工智能与地图学结合的概念已经被提出很久了,但是过去受限于人工智能工具的计算能力等原因,并未取得很大的成功。近年来,随着GPT等大语言模型和Stable Diffusion等视觉模型的提出,人工智能与地图学的结合更加紧密了,在制图信息获取、制图综合、制图流程、地图风格迁移、地图阅读等方面国内外也开展了大量探索。国际制图学会(ICA)在2019—2027年的战略计划中,就提到地图被认为是科学和社会问题的有效解决方案,新的社会和技术趋势带来了新的地图选择,但地图学也有成为信息技术(IT)或人工智能(AI)的一部分的威胁。国际制图学会在2023年国际地图学大会前还组织了制图学和AI(MapAI)的专题研讨会,研讨了深度伪造地图和卫星影像的影响、基于图像输入的机器学习、在地图布局中设计元素的自动化方法、使用人工智能解释地图、与地图的自然语言交互、使用人工智能模型进行制图、使用地图进行人机协作等主题,这些也是当前和未来人工智能在地图学应用的热点问题和重要方向。
[1]
陈述彭. 地图学面临的挑战与机遇[J]. 地理学报, 1994, 49(1):1-8.

[Chen S P. Challenges and opportunities faced by cartography[J]. Acta Geographica Sinica, 1994, 49(1):1-8.] DOI:10.11821/xb199401002

[2]
周成虎. 全息地图时代已经来临——地图功能的历史演变[J]. 测绘科学, 2014, 39(7):3-8.

[Zhou C H. The era of holographic map has come-the historical evolution of map function[J]. Science of Surveying and Mapping, 2014, 39(7):3-8.] DOI:10.16251/j.cnki.1009-2307.2014.07.001

[3]
郭仁忠, 陈业滨, 赵志刚, 等. 泛地图学理论研究框架[J]. 测绘地理信息, 2021, 46(1):9-15.

[Guo R Z, Chen Y B, Zhao Z G, et al. A theoretical framework for the study of pan-maps[J]. Journal of Geomatics, 2021, 46(1):9-15.] DOI:10.14188/j.2095-6045.2020611

[4]
Brown T B, Mann B, Ryder N, et al. Language models are few-shot learners[C]. Proceedings of the 34th International Conference on Neural Information Processing Systems. ACM, 2020:1877- 1901. DOI:10.5555/3495724.3495883

[5]
Openai, Achiam J, Adler S, et al. GPT-4 Technical Report[EB/OL]. arXiv.org. (2023-03-15)[2024-03-01]. https://arxiv.org/abs/2303.08774v4.

[6]
Zhang L, Rao A, Agrawala M. Adding Conditional Control to Text-to-Image Diffusion Models[C/OL]// Proceedings of the IEEE/CVF International Conference on Computer Vision. 2023:3836-3847[2024-03-01]. https://openaccess.thecvf.com/content/ICCV2023/html/Zhang_ Adding_Conditional_Control_to_Text-to-Image_Diffusion_Models_ICCV_2023_paper.html.

[7]
王飞跃, 缪青海, 张军平, 等. 探讨AI for Science的影响与意义:现状与展望[J]. 智能科学与技术学报, 2023, 5(1):1-6.

DOI

[Wang F Y, Miao Q H, Zhang J P, et al. The DAOs to AI for Science by DeSci: The state of the art and perspective[J]. Chinese Journal of Intelligent Science and Technology, 2023, 5(1):1-6.]

[8]
Hu Y J, Gao S, Lunga D, et al. GeoAI at ACM SIGSPATIAL: progress, challenges, and future directions[J]. SIGSPATIAL Special, 2019, 11(2):5-15. DOI:10.1145/3377000.3377002

[9]
刘瑜, 郭浩, 李海峰, 等. 从地理规律到地理空间人工智能[J]. 测绘学报, 2022, 51(6):1062-1069.

DOI

[Liu Y, Guo H, Li H F, et al. A note on GeoAI from the perspective of geographical laws[J]. Acta Geodaetica et Cartographica Sinica, 2022, 51(6):1062-1069.] DOI:10.11947/j.AGCS.2022.20220125

[10]
高松. 地理空间人工智能的近期研究总结与思考[J]. 武汉大学学报(信息科学版), 2020, 45(12):1865-1874.

[Gao S. A review of recent researches and reflections on geospatial artificial intelligence[J]. Geomatics and Information Science of Wuhan University, 2020, 45(12):1865-1874.] DOI:10.13203/j.whugis20200597

[11]
王家耀, 武芳, 闫浩文. 大变化时代的地图学[J]. 测绘学报, 2022, 51(6):829-842.

DOI

[Wang J Y, Wu F, Yan H W. Cartography: Its past, present and future[J]. Acta Geodaetica et Cartographica Sinica, 2022, 51(6):829-842.]

[12]
陈述彭. 新型地图产品前瞻[J]. 地球信息科学, 2005, 7(2):8-10.

[Chen S P. Prospect of new map products[J]. Geo-information Science, 2005, 7(2):8-10.] DOI:10.3969/j.issn.1560-8999.2005.02.003

[13]
History of artificial intelligence[Z/OL]// Wikipedia. (2024-03-10)[2024-03-17]. https://en.wikipedia.org/w/index.php?title=History_of_artificial_intelligence&oldid=1212891261

[14]
吴忠性. 地图学一个新的分支学科:制图领域专家系统正在我国形成[J]. 地图, 1994(4):14-16.

[Wu Z X. A new branch of cartography: Expert system in cartography field is taking shape in China[J]. Map, 1994(4):14-16.]

[15]
Buttenfield B P. Line structure in graphic and geographic space (computer cartography, artificial intelligence, generalization)[M]. University of Washington, 1984.

[16]
Fisher P F, Mackaness W A. Are cartographic expert systems possible?[C]. Proceedings AutoCarto, 1987,8:530-534.

[17]
Johnson D S, Basoglu U. The use of artificial intelligence in the automated placement of cartographic names[C]. Proceedings Auto-Carto, 1989,9: 225-230.

[18]
孙群. 专家系统以及它在地图制图领域中的应用[J]. 解放军测绘学院学报, 1992, 9(1):67-73.

[Sun Q. Expert system and its application in cartography[J]. Journal of the Pla Institute of Surveying and Mapping, 1992, 9(1):67-73.]

[19]
王家耀, 吴战家, 武芳. 制图综合专家系统工具研究[J]. 解放军测绘学院学报, 1992, 9(4):66-72.

[Wu Z J, Wu F. The research on tools of the cartographic generalization expert system[J]. Journal of the Pla Institute of Surveying and Mapping, 1992, 9(4):66-72.]

[20]
Buttenfield B P, Mark D M. Expert systems in cartographic design[M]. Modern Cartography Series. Academic Press, 1991,1:129-150.

[21]
孙群. 地图投影选择和应用问题的专家系统实现[J]. 解放军测绘学院学报, 1994, 11(4):289-295.

Implementation of expert system for selection and application of map projection[J]. Journal of Geomatics Science and Technology, 1994, 11(4):289-295.]

[22]
华一新. 用专家系统技术确定地图要素的表示等级[J]. 测绘通报, 1993(3):22-25.

[Hua Y X. Using expert system technology to determine the representation level of map elements[J]. Bulletin of Surveying and Mapping, 1993(3):22-25.]

[23]
Kazemi S, Lim S, Ge L. Integration of cartographic knowledge with generalization algorithms[C]. Proceedings. 2005 IEEE International Geoscience and Remote Sensing Symposium, 2005, IGARSS'05. IEEE, 2005, 5:3502-3505. DOI:10.1109/IGARSS.2005.1526600

[24]
艾廷华. 深度学习赋能地图制图的若干思考[J]. 测绘学报, 2021, 50(9):1170-1182.

DOI

Some thoughts on deep learning enabling cartography[J]. Acta Geodaetica et Cartographica Sinica, 2021, 50(9):1170-1182.]

DOI

[25]
任福, 翁杰, 王昭, 等. 关于智能地图制图的几点思考[J]. 武汉大学学报(信息科学版), 2022, 47(12):2064-2068.

[Ren F, Weng J, Wang Z, et al. Some thoughts on smart cartography[J]. Geomatics and Information Science of Wuhan University, 2022, 47(12):2064-2068.] DOI:10.13203/j.whugis20220781

[26]
Kang Y, Gao S, Roth R. A Review and Synthesis of Recent GeoAI Research for Cartography: Methods, Applications, and Ethics[J]. Proceedings of AutoCarto,2022:2-4.

[27]
Jiao C J, Heitzler M, Hurni L. A survey of road feature extraction methods from raster maps[J]. Transactions in GIS, 2021, 25(6):2734-2763. DOI:10.1111/tgis.12812.

[28]
Touya G, Brisebard F, Quinton F, et al. Inferring the scale and content of a map using deep learning[J]. The International Archives of the Photogrammetry, Remote Sensing and Spatial Information Sciences, 2020,:17-24. DOI: 10.5194/isprs-archives-xliii-b4-2020-17-2020

[29]
Lynn Usery E, Arundel S T, Shavers E, et al. GeoAI in the US Geological Survey for topographic mapping[J]. Transactions in GIS, 2022, 26(1):25-40. DOI:10.1111/tgis.12830

[30]
Kang Y H, Gao S, Roth R E. Transferring multiscale map styles using generative adversarial networks[J]. International Journal of Cartography, 2019, 5(2/3):115-141. DOI: 10.1080/23729333.2019.1615729

[31]
Christophe S, Mermet S, Laurent M, et al. Neural map style transfer exploration with GANs[J]. International Journal of Cartography, 2022, 8(1):18-36. DOI: 10.1080/23729333.2022.2031554

[32]
Kent A J. Form follows feedback: Rethinking cartographic communication[J]. Westminster Papers in Communication and Culture, 2018, 13(2):96-112. DOI:10.16997/wpcc.296

[33]
Board C. Cartographic communication[J]. Cartographica: the International Journal for Geographic Information and Geovisualization, 1981, 18(2):42-78. DOI:10.3138/8r07-2125-l843-0767

[34]
MOLES A. Théorie de l’information et message cartographique[J]. Sciences et enseignement des sciences, 1964, 5(32):11-16.

[35]
Koláčný A. Cartographic Information—a Fundamental Concept and Term in Modern Cartography[J]. The cartographic journal, 1969, 6(1):47-9. DOI:10.1179/caj.1969.6.1.47

[36]
廖克. 现代地图学[M]. 北京: 科学出版社, 2003.

[Liao K. Modern cartography[M]. Beijing: Science Press, 2003.]

[37]
Brassel K E, Weibel R. A review and conceptual framework of automated map generalization[J]. International Journal of Geographical Information Systems, 1988, 2(3):229-244. DOI:10.1080/02693798808927898.

[38]
高博, 赵军喜. 基于计算机的地图传输理论[J]. 地图, 2000(3):5-8.

[Zhao J X. Map transmission theory based on computer[J]. Cartography, 2000(3):5-8.]

[39]
Li W W, Zhou B, Hsu C Y, et al. Recognizing terrain features on terrestrial surface using a deep learning model: An example with crater detection[C]// Proceedings of the 1st Workshop on Artificial Intelligence and Deep Learning for Geographic Knowledge Discovery. ACM, 2017:33-36. DOI:10.1145/3149808.3149814

[40]
Alkathiri M, Abdul J, Potdar M B. Geo-spatial big data mining techniques[J]. International Journal of Computer Applications, 2016, 135(11):28-36. DOI:10.5120/ijca2016908542

[41]
Li K, Wan G, Cheng G, et al. Object detection in optical remote sensing images: A survey and a new benchmark[J]. ISPRS Journal of Photogrammetry and Remote Sensing, 2020, 159:296-307. DOI:10.1016/j.isprsjprs.2019.11.023

[42]
Xiao Z F, Liu Q, Tang G F, et al. Elliptic Fourier transformation-based histograms of oriented gradients for rotationally invariant object detection in remote-sensing images[J]. International Journal of Remote Sensing, 2015, 36(2):618-644. DOI:10.1080/01431161.2014.999881

[43]
Xia G S, Bai X, Ding J, et al. DOTA: A large-scale dataset for object detection in aerial images[C]// 2018 IEEE/CVF Conference on Computer Vision and Pattern Recognition. IEEE, 2018:3974-3983. DOI:10.1109/CVPR.2018.00418

[44]
Zhang F, Du B, Zhang L P. Scene classification via a gradient boosting random convolutional network framework[J]. IEEE Transactions on Geoscience and Remote Sensing, 2016, 54(3):1793-1802. DOI:10.1109/TGRS.2015.2488681

[45]
Ying C, Ouyang X, Agam G. ChangeNet: Learning to detect changes in satellite images[C]// Proceedings of the 3rd ACM SIGSPATIAL International Workshop on AI for Geographic Knowledge Discovery. ACM, 2019:24-31. DOI:10.1145/3356471.3365232

[46]
Chen Y S, Lin Z H, Zhao X, et al. Deep learning-based classification of hyperspectral data[J]. IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing, 2014, 7(6):2094-2107. DOI:10.1109/JSTARS.2014.2329330

[47]
Li W J, Fu H H, Yu L, et al. Deep learning based oil palm tree detection and counting for high-resolution remote sensing images[J]. Remote Sensing, 2016, 9(1):22. DOI: 10.3390/rs9010022

[48]
Tiecke T G, Liu X M, Zhang A, et al. Mapping the world population one building at a time[EB/OL]. 2017: arXiv:1712.05839. http://arxiv.org/abs/1712.05839

[49]
Srivastava S, Vargas Muñoz J E, Lobry S, et al. Fine-grained landuse characterization using ground-based pictures: A deep learning solution based on globally available data[J]. International Journal of Geographical Information Science, 2020, 34(6):1117-1136. DOI:10.1080/13658816.2018.1542698

[50]
Duan W W, Chiang Y Y, Knoblock C A, et al. Automatic alignment of geographic features in contemporary vector data and historical maps[C]// Proceedings of the 1st Workshop on Artificial Intelligence and Deep Learning for Geographic Knowledge Discovery. ACM, 2017:45-54. DOI:10.1145/3149808.3149816

[51]
Camacho K, Portelli R, Shortridge A, et al. Sentiment mapping: Point pattern analysis of sentiment classified Twitter data[J]. Cartography and Geographic Information Science, 2021, 48(3):241-257. DOI:10.1080/15230406.2020.1869999

[52]
Khairuddin A R, Talib M S, Haron H. Review on simultaneous localization and mapping (SLAM)[C]. 2015 IEEE International Conference on Control System, Computing and Engineering (ICCSCE),IEEE, 2015:85-90. DOI:10.1109/ICCSCE.2015.7482163

[53]
Shih C Y, Chen Y H, Lee T Y. Map art style transfer with multi-stage framework[J]. Multimedia Tools and Applications, 2021, 80(3):4279-4293. DOI:10.1007/s11042-020-09788-4

[54]
Tao R, Xu J W. Mapping with ChatGPT[J]. ISPRS International Journal of Geo-Information, 2023, 12(7):284. DOI:10.3390/ijgi12070284

[55]
Juhász L, Mooney P, Hochmair H H, et al. ChatGPT as a mapping assistant: A novel method to enrich maps with generative AI and content derived from street-level photographs[R]. arXiv preprint arXiv:2306.03204, 2023. DOI: 10.25436/E2ZW27

[56]
Feng Y, Thiemann F, Sester M. Learning cartographic building generalization with deep convolutional neural networks[J]. ISPRS International Journal of Geo-Information, 2019, 8(6):258. DOI:10.3390/ijgi8060258

[57]
Sester M, Feng Y, Thiemann F. Building generalization using deep learning[J]. The International Archives of the Photogrammetry, Remote Sensing and Spatial Information Sciences, 2018,XLII-4:565-572. DOI:10.5194/isprs-archives-xlii-4-565-2018

[58]
韩杨丽. 基于流形学习的地图颜色自动转移方法研究[D]. 南京: 南京师范大学, 2020.

[Han Y L. Research on automatic color transfer method of map based on manifold learning[D]. Nanjing: Nanjing Normal University, 2020.] DOI:10.27245/d.cnki.gnjsu.2020.000702

[59]
吴明光, 孙彦杰, 闾国年. 地图风格迁移: 概念、综述与展望[J]. 武汉大学学报(信息科学版), 2022, 47(12):2069-2084.

[Wu M G, Sun Y J, Lv G N. Cartographic Style Transfer:Idea,Review and Envision[J]. Geomatics and Information Science of Wuhan University, 2022, 47(12):2069-2084.] DOI:10.13203/j.whugis20220439

[60]
Kang Y, Gao S, Roth R E. Artificial Intelligence Studies in Cartography: A Review and Synthesis of Methods, Applications, and Ethics[J]. Cartography and Geographic Information Science, 2024:1-32. DOI:10.1080/15230406.2023.2295943

[61]
Kimerling A J, Muehrcke P C, Muehrcke J O, et al. Map use: reading, analysis, interpretation[M]. ESRI Press Academic, 2016.

[62]
杨启和, 朱文忠, 黄文骞. 地图模式识别研究的介绍与展望[J]. 测绘科技通讯, 1996(3):16-20.

[Yang Q H, Zhu W Z, Huang W (J /Q). Introduction and prospect of map pattern recognition research[J]. Geomatics Technology and Equipment, 1996(3):16-20.]

[63]
周熙然, 李德仁, 薛勇, 等. 地图图像智能识别与理解:特征、方法与展望[J]. 武汉大学学报(信息科学版), 2022, 47(5):641-650.

[Li D R, Xue Y, et al. Intelligent map image recognition and understanding: Representative features, methodology and prospects[J]. Geomatics and Information Science of Wuhan University, 2022, 47(5):641-650.] DOI:10.13203/j.whugis20210300

[64]
Li H L, Liu J, Zhou X R. Intelligent map reader: A framework for topographic map understanding with deep learning and gazetteer[J]. IEEE Access, 1809, 6:25363-25376. DOI:10.1109/ACCESS.2018.2823501

[65]
Hu Y J, Gui Z P, Wang J M, et al. Enriching the metadata of map images: A deep learning approach with GIS-based data augmentation[J]. International Journal of Geographical Information Science, 2022, 36(4):799-821. DOI: 10.1 080/13658816.2021.1968407

[66]
Chang S C, Palzer D, Li J L, et al. MapQA: A dataset for question answering on choropleth maps[EB/OL]. 2022: arXiv:2211. 08545. http://arxiv.org/abs/2211.08545

文章导航

/