摘要
随着生成式人工智能(AIGC)为代表的新一代人工智能的快速发展,加速了各个学科转向人工智能驱动的科学研究,地理空间智能(GeoAI)技术在解决传统制图学任务注定会比传统的方法具有更好的性能,地图学也因此迎来了新的机遇与挑战,产生智能地图制图新领域,形成智能地图制图学。地图学研究有人工智能传统,但是过去受限于人工智能工具的计算能力等原因,并未取得很大的进展。随着进入智能化时代,人与机器都将成为制图与读图的主体。
地图内容的产生经历了专家生成内容和用户生成内容的阶段,正在向人工智能生成内容阶段发展。人工智能与地图传输模型的结合衍生出智能地图传输模型,包括制图信息智能获取、智能制图、智能读图、地图信息智能解读4个环节,进而从这4个方面对智能地图的研究进展进行了分析和梳理。研究显示,使用智能化方法解决地图学问题的研究仍然处于起步阶段,人工智能与地图学结合仍存在诸多挑战,包括缺乏训练数据集、模型算法缺乏泛化能力和可解释性等,这些也是未来可以发展的方向。
1. 引言
地图既是地球空间信息的可视化形式和人类空间形象思维的表现,也是空间信息传输与认知的重要手段,随着时代的发展,地图学也面临着诸多的机遇与挑战。地图以科学的符号系统、地图投影和综合方法表达复杂地理世界的空间结构和空间关系,移动互联网络、传感网、物联网和智能移动终端的飞速发展使得信息内容更丰富、获取形式更多样,人与人、人与物、物与物之间按需进行信息获取、传递、存储、认知、决策等功能的地图新形式已经来临。
信息与通信技术的快速发展带动人类进入地理空间、人文社会空间和信息空间相融合的三元空间,地图制图的目的、人员、对象和环境等均发生巨大变化,地图的类型、空间对象、表达维度、地图角色等呈现出显著泛化特征,现有地图学理论无法引领和指导当代的地图实践。
生成式人工智能(AIGC)模型代表的新一轮人工智能技术浪潮正推动人类社会全面变革,受到了学术界、工业界和大众的广泛关注。以GPT-3和GPT-4等为代表的大型语言模型(LLM)、Stable Diffusion为代表的文本转图像模型的发展,加速了人工智能研发。各个学科的科学研究范式也正加速转换,越来越多的学者也转向人工智能驱动的科学研究(AI for science)。
通过机器学习,特别是深度学习,人工智能为计算机视觉、自然语言处理等一系列具有巨大挑战性的问题提供了很好的解决方案。对于地理学而言,地理空间领域的智能化发展和研究迎来了新的机遇和挑战。地理空间科学与人工智能相交叉形成了地理空间人工智能(GeoAI)的研究方向,目前已经在空间表征学习、时空预测和空间插值、对地资源环境监测、地图学、地理文本语义分析等方面开展应用。
地图学与人工智能交叉融合,产生智能地图制图新领域,形成智能地图制图学。正如陈述彭院士所说"地图是永生的,作为人类的一种文化工具,地学的第二语言,决不会由于数字化、电子化反而无所作为。"人工智能时代的到来给地图学的下一个辉煌提供了难得的历史转机,同时也提出了严峻挑战。
2. 人工智能在地图学中的发展
2.1 地图学研究的人工智能传统
人工智能是指在机器中模拟人类智能,其发展可以追溯到20世纪50年代,经历了多次发展与兴衰。2011年以后进入了深度学习和大数据发展时期,大多数的深度学习模型都是基于人工神经网络(ANN)发展起来的,例如卷积神经网络(CNN)、对抗神经网络(GAN)等。自2020以来又进入了AI时代和生成人工智能时期,transformer构架的大语言模型不断涌现。
人工智能技术应用在制图领域并非一个新话题,吴忠性就认为地图学的发展可分为三大阶段:第一个阶段是建立现代地图学的科学体系;第二个阶段是出现了计算机辅助制图;第三个阶段将人工智能与专家系统应用到制图领域。早在20世纪80至90年代,国内外学者就开始探讨人工智能在地图学中的应用。
早期研究方向
- Buttenfield通过研究图形和地图空间中的线状要素结构特征,提出了使用计算机制图和人工智能技术进行制图综合
- Fisher等探讨了地图制图专家系统的可能性和发展前景
- Johnson等提出了使用专家系统来帮助地图标注在地图上的放置,并用神经网络技术来补充协助创建地图标注放置的规则
专家系统应用领域
- 地图设计和生产
- 矢量和栅格制图要素的自动提取
- 地图投影选择
- 地图要素表示等级确定
- 地图要素的自动制图综合
专家系统的实现难度在于首先需要收集地图专家的知识经验,总结成可供计算机使用的知识库的形式(例如决策树),然后需要为计算机系统设计一套推理的流程。在许多时候,地图学中的知识无法通过简单的IF语句、决策树或数学公式表达,这就导致了针对某些制图学问题的知识库难以构建和推理流程难以构建,这是专家系统未能取得突破性成功的重要原因之一。总而言之,早期研究专注于使用人工智能方法应用到传统的地图学任务中,尝试实现部分制图过程的自动化。
2.2 地图内容生产的智能化发展
内容生产的发展通常可以分为3个阶段:专家生成内容(Professionally Generated Content,PGC)、用户生成内容(User Generated Content,UGC)、及AI生成内容(AI Generated Content,AIGC),地图内容从产生模式同样也可以分为:PGC地图阶段、UGC地图阶段、AIGC地图阶段。
阶段 | 特点 | 创作主体 | 规模 | 效率 | 质量 | 成本 |
---|---|---|---|---|---|---|
PGC地图 | 专家生成内容 | 地图专家 | 小 | 生成慢 | 高 | 高 |
UGC地图 | 用户生成内容 | 用户 | 大 | 生成快 | 低 | 低 |
AIGC地图 | 人工智能生成内容 | 人+机器 | 大 | 生成快 | 不稳定 | 低 |
地图内容生产的三个阶段
PGC地图阶段
传统的地图制作是由专业人员完成,制作过程专业性强,需要专业的制图知识和技能,地图作品生成慢、成本高,但是质量有保证,内容权威。
UGC地图阶段
随着互联网的兴起,地图的制作变得容易,普通大众也可以制作地图,拉低了地图制作的专业门槛。地图作品生成快、成本低,但由于用户水平层次不齐也造成地图创作内容质量不能得到保证。
AIGC地图阶段
进入智能化时代,人与机器都将成为制图与读图的主体,通过人工智能算法,能够快速地、低成本、大规模的生成地图作品,但是也存在地图作品质量不稳定等问题。
总的来说,目前地图内容的产生仍处于专家生成内容和用户生成内容的阶段为主,正在向人工智能生成内容阶段发展。
生成式人工智能新技术的发展为地图学带来了新的机遇与挑战。生成式人工智能在现阶段可以通过3种形式产生地图内容,分别是文本生成地图(txt2map)、地图生成解释(map2txt)、地图风格迁移(map2map)。
文本生成地图
通过输入一段文字来生成地图
(txt2map)
地图生成解释
上传地图图片生成文字解释
(map2txt)
地图风格迁移
从图片实现地图风格的迁移
(map2map)
很显然由于这些功能并非针对地图,而是针对图像数据的所设计和研发,尽管借助人工智能方法或工具已经可以在一定程度上完成地图生成和地图解释,但目前AI生成的地图所生成的地图虽然快速但是较为随机且不稳定,并非像地图那样是真实世界的映射;AI读图做出的解释缺乏上下文信息和针对性;地图风格的迁移更像艺术地图,而非科学地图,缺乏实用性。此外,目前基于AI的智能读图和智能制图大部分是黑箱模型,人们无法对其机理进行解释和说明。
3. 地图传输模型的智能化发展
3.1 地图传输模型
地图的制作和应用是地图学的2个核心问题和任务。地图传输模型(Map Communication Model)借鉴了信息论的观点,描述了地图信息的创造和传播的整个过程,把地图视为一种交流工具,以优化地图的效率。地图作为传输方式的思想是Keates在1964年在伦敦的会议上引入的,但最早的地图传输模型是由Moles在1964年所设计,对地图传输模型发展最有影响力的早期贡献是由Koláčný在1969年提出。
Koláčný以制图者对现实有选择性的观察为模型的起点,通过地图符号的语言,实现了现实多维知识模型向地图信息的转化,这些信息被读图者读取并理解,形成对现实世界的认知,整个地图传输模型的过程的核心概念是地图信息的传递。总而言之,地图传输模型描述了制图者把对客观世界的认识加以选择、分类、简化等信息加工并经过符号化,通过地图传递给用图者,用图者经过符号识别,同时通过对地图的分析和解译形成对客观世界的认识的过程。
与20世纪60年代和70年代的地图制作过程相比,今天的地图学在制图者与地图之间以及地图与用户之间都显得更有交互性。随着数字制图的发展,今天的地图制作和编辑过程对用户和制图者的审美判断更加敏感,审美也不足以区分专业制图人员和业余人员。换言之,制图学的门槛在新兴数字制图工具的引领下降低了,也使制图效率得以提高。除此之外,许多新型地图产品也陆续出现,如多媒体地图、三维地图、增强现实地图等,这些产品区别于传统意义上的地图。总而言之,数字时代的发展和数字地图的出现改变了传统的地图学的范式,传统的地图传输模型各个环节的内涵也发生了重大改变。因此,需要提出一种新的地图传输模型来适应数字化时代。
3.2 智能地图传输模型
随着地图学的发展已经进入了智能化时代,人工智能可以在地图传输模型的各个环节结合,这些结合也是地图学未来智能化发展的方向。在传统的地图传输模型中,制图和读图的主体都是人。在经历了传统地图时代、数字地图时代后,人与机器共同成为制图的主体。进入智能化时代,人与机器都将成为制图与读图的主体,智能制图与智能读图应运而生。
智能地图传输模型
Koláčný所提出的经典地图传输模型在AI的加持下衍生为智能地图传输模型,包括4个环节:
制图信息智能获取
通过人工智能方法采样、收集现实世界地理环境的信息,经过加工、筛选成结构化的用于制图的信息。
智能制图
制图信息通过色彩、符号、分级等表示方法智能生成地图的过程。
智能读图
读图者利用人工智能方法,结合地图语言、领域知识和个人理解对现实世界认识的过程。
地图信息智能解读
利用人工智能对地图做出解释,从而获得对现实世界的认知和理解。
3.3 AI与地图的应用结合模式
人工智能方法以"AI+地图"的模式与地图应用开展结合。AI辅助制图数据的获取,极大的丰富了数据源,帮助制图者快速的获取大量制图数据。
AI辅助制图流程,加速制图的流程,以智能制图环节为例,制图综合是制图学中的传统任务,过去严重依赖于知识和经验,而人工智能模型(如深度卷积神经网络)可以帮助解决一部分制图综合任务。风格迁移则是计算机视觉和图形学兴起后流行的一种技术,通过将一个图像的内容与另一个图像的风格相结合来生成新图像,学者们把风格迁移应用于地图图像上,从而催生了地图风格迁移(map style transfer)。AI辅助读图则通过地图文本提取、符号识别、内容识别等方式增强对地图的理解。由此可见,人工智能技术改变了传统地图学的制图和读图的方式方法,还催生了新的制图和读图领域。
4. 智能地图制图学的研究进展
4.1 制图智能信息获取
进入智能化时代,我们可以更加便捷和高效地利用地理空间智能方法从现实世界采样和提取更加精确的信息。目前,制图信息获取智能化实现主要体现在遥感图像的目标检测、地理大数据挖掘等方面。
遥感图像目标检测的主要方法
近年来,许多基于深度学习的目标检测方法的方法被提出,这些方法显著提高了目标检测的速率和准确度。一般来说,现有的用于目标检测的深度学习方法可以根据是否生成候选区域分为两种类型:
- 基于区域建议(region-proposal-based)的方法
- 基于回归(regression-based)的方法
很多研究小组开发了对地观测的图像数据集(例如RSOD、DOTA、DIOR等),人们使用可以这些公开的数据集来提取特定的地物,这意味着图像中额外的信息被发现了,人们不需要通过先验知识和经验来推断一幅图像的内涵。这些结果在一定条件下,也可以作为制图的数据来源。
深度学习技术已经被用于卫星图像解译、卫星图像分析等任务。一些过去无法想象的全球尺度制图数据获取,如全球的树木检测、全球的建筑制图成为可能。人们还利用深度学习从其他来源的地理空间图像提取信息,例如街景照片、扫描历史地图、情绪制图等。
此外基于某种移动设备(如机器人、无人机、手机等)的SLAM(Simultaneously Localization and Mapping)技术可以实现从一个未知环境里的未知地点出发,在运动过程中通过传感器(如激光雷达、摄像头等)观测定位自身位置、姿态、运动轨迹,再根据自身位置进行增量式的地图构建,从而达到同时定位和地图构建的目的。
4.2 智能制图
众多研究者对智能制图的理论和方法进行了广泛的探讨,包括:地图风格迁移(map style transfer)、使用ChatGPT等人工智能工具制图、制图综合等。
地图风格迁移
随着生成对抗网络(GAN)模型在图像领域风格迁移的广泛应用,地图的风格迁移也成为当前的研究热点,国内外学者开展了大量研究。
地图风格迁移在实现风格转换方面效果显著,但现有的风格迁移大多为栅格的迁移,在地图细节上经常出错。基于矢量的风格迁移方法在未来可能会有更大的应用空间。
ChatGPT辅助制图
自ChatGPT等大语言模型(Large Language Models, LLM)问世以来,人们对于人工智能平台的关注日渐增加,许多地图学家也尝试将它们用于制图实践。
使用ChatGPT制图的好处是,降低了制作地图的门槛、提高了制作地图的效率,而且可以启发制图者对地图的设计。但是,这种制图方法仍然存在一定的缺陷,如回答具有随机性,需要多次迭代才能绘制满意的地图。
智能制图综合
智能化的地图综合取得突破,研究者将深度卷积神经网络(DCNNs)用于制图综合任务,特别是建筑物的制图综合任务中。
目前已有的研究涵盖了制图综合、使用人工智能工具辅助制图等制图环节,但目前还无法使用智能方法构建完整的制图流程。
4.3 智能读图
地图读图和解读通常包括阅读地图并确定地图所描绘的内容以及制图者如何制图的过程,这包括识别描绘地理对象的特征、现象、使用的符号和标签,甚至包括不在地图中显式表达的地图信息。
地图读图的三个层面
地图阅读
从输入的地图集中识别和确定特征位置、标签和符号属性,包括对象提取和本体构建等任务。
地图解释
通过人类认知来解释地图特征及其在世界上的对应特征之间的关系,是地图阅读的进一步延伸。例如,描述和推断一幅地图的空间位置和空间范围。
地图分析
在地图阅读和地图解释之后对地图进行的分析推理。目前,关于使用地理空间智能分析地图的研究很少。
杨启和等很早就提出地图模式识别的概念,通过地图模式识别使计算机实现人对地图的阅读和理解,采用机器模拟人类视觉系统,模拟人脑对视觉信息的分析判决过程。周熙然等从地图内容提取与识别、地图语义分析两个层次,探讨了支持泛源地图图像大数据识别的理论与技术框架。
Li等提出了一种地名信息的智能地图阅读方法,该框架将深度学习技术和地名录相结合,对地图的内容进行自动准确的理解。这个框架通过深度学习方法检测地图文本,基于图形的分割和聚类分离文本单元,使用OCR引擎进行字符识别,实现基于数字地名录的地图内容理解。
4.4 地图信息智能解读
目前地图信息智能解读的研究较少,缺乏关于地图智能分析的研究。虽然目前通用的人工智能工具(如ChatGPT)来解读地图已经可行,但缺乏专业性和针对性,很难对地图进行深层次的理解。
目前的地图信息智能解读研究,主要围绕地图信息增强、地图问答系统的。Hu等提出了一种基于深度学习方法来增强地图图像信息的方法,通过添加从地图图像中提取的空间范围和地名来丰富地图图像的元数据,从而增强了地图的可用性和地图图像信息的丰富性。
在地图问答系统方面,Chang等建立MapQA数据集,包含了大约80万对问答和6万张图像的数据集,进而基于MapQA数据库提出了基于问答的视觉多输出数据提取算法(V-MODEQA),这种算法通过多输出模型从地图图像中提取底层结构化数据,然后进行推理,能够回答一些简单的地图问答。Chang等不仅开发了一种提取和推 理地图图像信息的方法,还通过问答的方式提供了一种解释地图的方法,这种方法可以从地图中提取信息并进行推理。
5. 总结与展望
人工智能与地图学的结合已经取得了一定的进展,但仍然存在诸多挑战。本节总结了当前研究中存在的主要问题,并对未来发展方向进行展望。
缺乏训练数据集
目前无论是通过人工智能算法自动制图产生的地图,还是读图产生的解释文字,或是风格迁移产生的风格地图,看上去"智能"产生内容往往都不能使用,更像天马行空的艺术作品创作,而非科学严谨的专业地图成果。主要原因是目前的大语言模型和视觉模型都基于通用语料库和图像库,缺乏针对制图规则、地图领域知识的语料库,缺乏专门的地图训练数据集。
模型缺乏泛化能力
智能地图模型算法不光要在训练集上表现良好,还要能够在先前未观测的新数据上表现良好。一方面,增加数据样本可以提高模型的泛化能力,可以通过数据增强、迁移学习、集成学习等技术来扩充数据集。另一方面,需要研究如何把制图经验和地学领域知识转变为逻辑推理,如何利用智能方法组件一套自动制图流程和可视化规则。
缺乏可解释性
目前大部分的大语言模型和视觉模型都是人工智能"黑盒"模型,虽然可以实现从文字来生成地图,也可以由地图来自动产生文字解释,甚至还可以从图片实现地图风格的迁移,但目前的生成内容普遍存在不确定性和偶然性,缺乏科学解释,缺乏上下文信息和针对性。因此需要发展可解释、可扩展、可信赖、安全可靠的智能地图模型算法。
人工智能工具的出现推进了地图学的智能化进步,使得绘制一幅地图的门槛和成本大大降低。尽管人工智能与地图学结合的概念已经被提出很久了,但是过去受限于人工智能工具的计算能力等原因,并未取得很大的成功。近年来,随着GPT等大语言模型和Stable Diffusion等视觉模型的提出,人工智能与地图学的结合更加紧密了,在制图信息获取、制图综合、制图流程、地图风格迁移、地图阅读等方面国内外也开展了大量探索。
国际制图学会(ICA)在2019—2027年的战略计划中,就提到地图被认为是科学和社会问题的有效解决方案,新的社会和技术趋势带来了新的地图选择,但地图学也有成为信息技术(IT)或人工智能(AI)的一部分的威胁。国际制图学会在2023年国际地图学大会前还组织了制图学和AI(MapAI)的专题研讨会,研讨了深度伪造地图和卫星影像的影响、基于图像输入的机器学习、在地图布局中设计元素的自动化方法、使用人工智能解释地图、与地图的自然语言交互、使用人工智能模型进行制图、使用地图进行人机协作等主题,这些也是当前和未来人工智能在地图学应用的热点问题和重要方向。
延伸阅读
以下是关于智能地图制图学和地理空间人工智能的推荐阅读资料,可帮助您深入了解这一领域的最新进展和未来发展方向。
《GeoAI: Spatially Explicit Artificial Intelligence Techniques for Geographic Knowledge Discovery and Beyond》
作者:Shashi Shekhar, Zhe Jiang, Reem Y. Ali, Emre Eftelioglu, Xun Tang, Venkata M.V. Gunturi, Xun Zhou
出版信息:International Journal of Geographical Information Science, 2015
这本著作全面介绍了地理空间人工智能(GeoAI)的基本概念、技术和应用,是了解地理空间数据与人工智能结合的重要参考资料。
《Artificial Intelligence for Cartography: A Survey》
作者:Yao-Yi Chiang, Stefan Leyk, Johannes H. Uhl
出版信息:Cartography and Geographic Information Science, 2020
这篇综述论文详细回顾了人工智能在地图制图领域的应用,包括历史发展、当前技术和未来趋势,为理解AI如何改变地图制图提供了系统性视角。
《Deep Learning for Remote Sensing Data》
作者:Xiao Xiang Zhu, Devis Tuia, Lichao Mou, Gui-Song Xia, Liangpei Zhang, Feng Xu, Friedrich Fraundorfer
出版信息:IEEE Geoscience and Remote Sensing Magazine, 2017
这篇文章深入探讨了深度学习技术在遥感数据处理和分析中的应用,对于理解智能地图制图中的数据获取环节具有重要参考价值。
《Intelligent Map Generalization: State of the Art and Future Challenges》
作者:Tinghua Ai, Jantien Stoter, Martien Molenaar
出版信息:International Journal of Geographical Information Science, 2018
这本书详细讨论了智能地图综合的最新进展和未来挑战,对于理解如何利用人工智能技术实现自动化地图综合提供了深入见解。
《Neural Style Transfer for Maps: A Comprehensive Evaluation》
作者:Min-Gyeong Kang, Yao-Yi Chiang
出版信息:Transactions in GIS, 2022
这篇论文全面评估了神经风格迁移技术在地图设计中的应用,对于理解如何利用AI技术创造具有特定风格的地图提供了宝贵参考。