地球信息科学理论与方法

城市内涝场景下的微地图制作方法

  • 富璇 , 1, 2, 3 ,
  • 闫浩文 , 1, 2, 3, * ,
  • 王小龙 4, 5 ,
  • 闫晓婧 1, 2, 3 ,
  • 王卓 6, 1 ,
  • 马文骏 1, 2, 3
展开
  • 1.兰州交通大学测绘与地理信息学院,兰州 730070
  • 2.地理国情监测技术应用国家地方联合工程研究中心,兰州 730070
  • 3.甘肃省地理国情监测工程实验室,兰州 730070
  • 4.兰州大学资源环境学院,兰州 730000
  • 5.西部环境教育部重点实验室,兰州 730000
  • 6.武汉大学资源与环境科学学院,武汉 430079
*闫浩文(1969—),男,甘肃民勤人,博士,教授,主要从事微地图、地图综合、空间数据安全和空间关系。 E-mail:

富 璇(2000—),女,甘肃白银人,硕士生,主要从事微地图研究。E-mail:

收稿日期: 2023-03-27

  修回日期: 2023-08-07

  网络出版日期: 2024-05-21

基金资助

甘肃省高等学校产业支撑计划项目(2022CYZC-30)

自然资源部城市国土资源监测与仿真重点实验室开放基金资助课题(KF-2022-07-015)

A We-Map Mapping Method for Urban Waterlogging Scenarios

  • FU Xuan , 1, 2, 3 ,
  • YAN Haowen , 1, 2, 3, * ,
  • WANG Xiaolong 4, 5 ,
  • YAN Xiaojing 1, 2, 3 ,
  • WANG Zhuo 6, 1 ,
  • MA Wenjun 1, 2, 3
Expand
  • 1. Faculty of Geomatics, Lanzhou Jiaotong University, Lanzhou 730070, China
  • 2. National-Local Joint Engineering Research Center of Technologies and Applications for National Geographic State Monitoring, Lanzhou 730070, China
  • 3. Gansu Provincial Engineering Laboratory for National Geographic State Monitoring, Lanzhou 730070, China
  • 4. College of Earth and Environmental Sciences, Lanzhou University, Lanzhou 730000, China
  • 5. Key Laboratory of Western China's Environmental Systems, Ministry of Education, Lanzhou 730000, China
  • 6. School of Resources and Environmental Sciences, Wuhan University, Wuhan 430079, China
*YAN Haowen, E-mail:

Received date: 2023-03-27

  Revised date: 2023-08-07

  Online published: 2024-05-21

Supported by

Industrial Support and Program Project of Universities in Gansu Province(2022CYZC-30)

Open Fund of Key Laboratory of Urban Nand Resources Monitoring and Simulation,Ministry of Natural Resources(KF-2022-07-015)

摘要

随着我国城市化进程的加快,城市内涝灾害愈加频繁,人民的生命和财产安全受到了严重的威胁。然而,城市内涝灾害在愈加频繁的同时,产生了诸如信息获取不及时、制图时效性低、地图信息冗余等问题,难以为救援提供及时响应。基于此,本文提出了一种面向城市内涝场景下的微地图制作方法。首先,调用微博API获取任意时间段内特定主题下的社交媒体文本数据,对数据进行清洗与预处理;接着,选取BiLSTM-CRF模型提取社交媒体中有关城市内涝的地名地址信息;然后,结合Dijkstra算法为用户推荐避开危险路段的最优路径;最后,结合灾害信息与实际场景,制作城市内涝场景下的微地图。实验结果表明: ①该方法能够有效识别城市内涝点,总体准确率达到92.7%; ②对比官方发布的积水点,本文提取的积水点与官方积水点大部分重叠,能够有效为传统监测方法提供补充信息; ③根据所得内涝点生成道路网级别的城市内涝地图,能够克服在海量地理空间信息中可视化冗余的不足,即有效缓解地理信息冗余的问题。由此可知,实时显示城市内涝信息,能够为用户掌握灾害现场的信息提供便利,调动他们参与制作微地图的积极性。与此同时,结合最优路径推荐,能够提高灾害应急场景下的制图时效。

本文引用格式

富璇 , 闫浩文 , 王小龙 , 闫晓婧 , 王卓 , 马文骏 . 城市内涝场景下的微地图制作方法[J]. 地球信息科学学报, 2024 , 26(5) : 1166 -1179 . DOI: 10.12082/dqxxkx.2024.230153

Abstract

The escalating urbanization in China has exacerbated waterlogging disasters, posing substantial threats to both human lives and property. In response to the challenges of inadequate mapping and redundant map data in urban waterlogging contexts, this study introduces a comprehensive four-stage methodology for We-Map cartography. This cartography encompasses data acquisition, extraction of waterlogging points, route optimization, and scene application. The initial step involves the retrieval of social media text data through queries to the Weibo Application Programming Interface (API) within a defined timeframe. The retrieved data are subsequently subjected to thorough cleaning and preprocessing procedures. Following this, the BiLSTM-CRF model is harnessed to discern urban waterlogging locations from the social media content, thereby enhancing recognition accuracy through contextual insights. Then, users are provided with optimal route for bypassing perilous road segments, achieved via the shortest path algorithm. Leveraging the online map as the foundational framework, the We-Map is generated within the urban waterlogging setting by overlaying multiple layers. Notably, the proposed method attains an impressive overall accuracy rate of 92.7% in pinpointing urban waterlogging locations, thereby substantially enhancing mapping efficiency. A comparative analysis between map-derived waterlogging points and official records reveals a substantial overlap, thus offering valuable supplemental information to conventional monitoring techniques. Furthermore, a road network-level map of urban waterlogging points is also generated to avoid redundancies in vast geospatial information. The identified flood-prone road sections can serve as a reference, while real-time display of urban waterlogging points, coupled with the shortest path algorithm, aids in recommending optimal routes. By leveraging the inherent attributes of "we-content" within the We-Map, this method expedites rapid mapping and fulfills the exigencies of swift mapping during emergencies. To cater to diverse user needs, urban flooding scenarios map are categorized with different tags aligned with their intended applications, encompassing home-bound routes, rescue maps, driving maps, walking maps, storm assistance maps, nearest rescue supplies maps, and more. Each map is endowed with at least one tag, streamlining accurate searches and usage by other users, and concurrently providing a reference for urban rescue operations. The proposed method ensures the coherence of map content and user requisites, facilitating efficient map sharing among users. The real-time dissemination of urban waterlogging information empowers users to swiftly comprehend disaster scenes, engendering their active involvement in We-Map production, and combining optimal path recommendation to augment cartographic responsiveness in emergency disaster scenarios. This approach bears substantial practical significance and promising application potential, constituting a robust for urban waterlogging emergency responses.

1 引言

21世纪以来,随着我国城市化水平的上升,城市内涝灾害发生的频率与强度,以及由此带来的损失在逐年增加,已对国民经济、人民生命财产安全与城市可持续发展构成严重威胁[1]。因此,在城市内涝灾害应急救援过程中,要及时加强与交通部门的沟通,提高制图时效[2]。不仅如此,还需要掌握道路交通情况,保证地图内容与用户需求的一致性,避免因堵车、绕路延误救援的最佳时机[3]
使用传统的监测手段,虽然可以对城市内涝应急灾害救援起到缓解作用,但是在制图方面存在人力成本高、时空局限性、信息时效性低和空间可视性差等不足[4]。具体而言,仅依靠专业制图人员,不仅制图时效低,且地图表示内容与用户需求信息也不一致。为了使地图的内容刚好够用而不冗余,低门槛高时效的微地图[5]被提出,其核心是面向平民大众的“草根”地图,数学精度要求不高,制作者无需经过严格的专业培训,地图用户也能够随时参与地图制作,能够使得地图的传播和分发更加快捷和方便。目前,微地图制作的研究多集中于微地图符号视觉变量的设计与应用[6]、简化面向符号生成环节的地图制图流程[7]、地标辅助用户寻路[8]以及微地图方向系统的构建[9]。这些研究从微地图制作和寻路的角度出发,通过符号设计和生成方式,以及方向系统或地标的构建,来降低用户的认知负担,从而提高地图的可读性和实用性。但是,在突发事件下(如城市内涝),用户无法实时掌握与更新现场灾害信息,地图制作简易而现势性不足,微地图制作的实时性和动态性面临着特殊的挑战[10]
以志愿者地理信息(Volunteered Geographic Information,VGI)为代表的社会感知方法是对物理传感器的重要补充,VGI是用户创建内容(User-Generated Content, UGC)、Web2.0等思想与地理信息系统相结合的产物,反映了互联网时代地理信息新的获取与应用方式,在自然灾害监测和预警中发挥着重要的作用。由于社交媒体广泛的参与度、丰富的时空动态信息、网络信息量大和及时性强等特点,被越来越多地应用到灾害的监测和灾情信息的获取之中[11],来自Facebook、Twitter、微博等社交媒体的地理参考数据也被认为是VGI,可以对真实空间事件和实体提供实时反馈。在灾害应急场景下,制图方式从专业制图人员自动专题制作[12]到缩短制图周期和降低制图门槛的转变,为灾害应急提供了新的制图思路,如众包模式开展的多方联动实景制图[13],为提高制图时效探究多尺度下的制图规则[14]。在城市内涝的探测中,国内已有研究将社交媒体数据用于时空分析[15]、信息挖掘[16]、风险评估[17]、事件点提取[18]等领域。Doulamis[19]等提出了一种模糊方案来检测多时间尺度上的演化事件; Asmai[20]等使用了一种主题建模方法,即术语频率-逆文档频率(Term Frequency-Inverse Document Frequency),来自动过滤洪水主题,但没有提取相关推文的位置名称和地理空间分布;王荩梓[21]采用BiLSTM-CRF算法对微博文本中地名进行提取,但由于人们对内涝位置的描述有详有略,可能导致可视化结果不一致,无法为用户寻路提供更为有效的参考信息。Zhang等[22]提出了识别洪水位置的社会感知方法,利用Bert-BiLSTM-CRF模型,基于语义信息区分洪水位置和公共位置,该方法虽然对救援提供了一定的参考信息,但是对于普通用户而言,无法调动其积极性来参与制图,大众制图参与度低。
总之,现有技术虽然能够有助于微地图制图,但依然存在如下2个方面的问题: ①当通过现有技术手段快速识别出城市内涝点时,地图信息会出现冗余,导致用户寻路时信息模糊不清; ②普通用户不能及时掌握灾害现场信息,信息获取滞后于灾情,受灾群众无法通过制图参与到灾害的响应与监测工作中,灾害场景下地图制作的现势性有待提升。
综上,针对城市内涝场景的微地图制图方式,结合社交媒体的实时性,提高地图制作的现势性;通过特定的可视化方法,解决地图信息冗余的问题。本文研究的主要内容是使用社交媒体文本数据作为微地图制作数据来源,运用自然语言处理(Natural Language Process,NLP)中的命名实体识别(Named Entity Recognition,NER),研究城市内涝场景下的制图方法。

2 研究方法

灾害应急导航微地图作为微地图的一个典型应用,其核心思想是地图制作和传播方式发生了变化:用户角色由用图者变为制图者,传播方式由点对点和点对多转变为多对多的传播,提高了地图的制作和传播时效。相比于现有的地图,本文以城市内涝为例,提出的微地图的制作方法优势在于它能够从社交媒体数据中获取实时的用户生成的信息,这些数据能够反映用户在实际内涝场景下的观察和经验。通过将这些信息展现到地图中,可以提供更精确、更及时的内涝情况来辅助用户寻路。此外,微地图具有传播快的特点,可以不断更新变化的内涝状况,方便用户获取最新的信息,参与制图或做出决策。
在本研究中,将社交媒体文本数据作为灾害场景下志愿者地理信息的数据来源,使用自然语言处理中的命名实体识别技术用于城市内涝点的识别,通过城市内涝点的可视化方法与最短路径算法结合,形成“数据获取-内涝点提取-路径推荐-地图制作”的制图流程,技术路线图如图1所示。
图1 技术流程

Fig. 1 Diagram of proposed scheme

将自然语言处理(NLP)和最优路径推荐结果应用于微地图的制作过程,可以提供更智能和自动化的导航体验和制图辅助服务。具体体现在:
(1)收集数据:自动收集特定主题下的社交媒体数据,社交媒体数据构成志愿者地理信息,丰富了灾害现场信息。帮助灾害应急机构更好地了解灾情、指导救援和评估救援效果,从而提高灾害应急响应的效率和精准性。
(2)自然语言处理(NLP):使用NLP技术来解析用户获取到的文本数据。通过命名实体识别技术,快速识别出文本信息中蕴含的城市内涝点,并以更加直观的方式展现到地图中。
(3)路径规划:利用收集到的道路网络数据和用户提供的起点和目的地信息,使用Dijkstra算法计算出最优行进路线。考虑到用户的需求和限制条件,如避开拥堵路段或提供无障碍路径。
(4)实时更新:对微地图进行实时更新,以反映交通状况、道路封闭或其他变化。通过整合实时数据源,不断更新并调整最优路径推荐,以提供准确和最新的导航指引。但是同样也存在特殊情况,例如由于道路、建筑等设防标准的不同,发生短时间内涝并不会显著影响道路交通通行。因此用户可结合自己的真实场景参与地图的绘制,提高了地图制作的现势性和地图传播的价值。

2.1 数据获取与预处理

微博拥有庞大的活跃用户群体,适用于研究特定主题,可以为灾害信息的获取提供数据支撑[23]。为了实时获取城市内涝点的分布情况,选用微博作为社交媒体文本数据来源。通过提供的应用编程接口(Application Programming Interfaces, API)访问微博平台,使用Selenium工具获取微博文本数据。Selenium是一个用于自动化浏览器操作的工具,通过模拟用户在浏览器中的操作,可以实现网页数据的获取。Selenium提供了一个中介角色,即WebDriver,它负责将客户端的操作转化为浏览器实际执行的操作,从而实现自动化操作、数据爬取、测试等。文本数据通过关键词查询,用户可根据自身需要,输入特定主题、选择任意时间段,自动获取到相关的微博文本数据。
根据获取到的城市内涝数据,对其进行预处理。经过去重、删除与内涝无关微博文本数据、删除表情符号等,来提高数据的质量和可用性。在命名实体识别中可将微博文本数据中城市内涝点的识别转化为序列标注问题,因此对数据进行以下处理:
(1)标注训练集:采用YEDDA(https://github.com/jiesutd/YEDDA)工具进行标注。本文规定在数据集中有三类实体,组织机构名称、地点名称和事件名称。所以,数据集中总共有7类标签:B-Org (组织机构的开始部分)、I-Org (组织机构的中间部分)、B-Loc(地点的开始部分)、I-Loc(地点的结束部分)、B-Event(事件的开始部分)、I-Event(事件的结束部分)、O(非实体信息)。
(2)标注完数据后将单个字和标签一一对应,生成新的带标注的文件。
(3)生成训练集与测试集:将数据集划分为训练集与测试集,按照7:3的比例进行划分。根据新的标注文件生成词表和标签缓存文件。

2.2 内涝点提取

命名实体识别是自然语言处理中的一项关键性任务,用于识别文本中特定意义的实体,如人名、地名、组织机构、专有名词等,其中BiLSTM-CRF模型是一种基于深度学习技术的语言处理模型[24]。使用BiLSTM-CRF模型识别城市内涝点能够充分利用上下文信息和全局优化策略,可以避免标注数据中存在的噪声或者错误标注的影响,从而提高识别的准确率和鲁棒性,被广泛应用于命名实体识别的信息抽取。因此,本文选用BiLSTM-CRF模型从社交媒体文本信息中提取城市内涝点。
BiLSTM (Bidirectional LSTM)即双向长短时记忆网络,是循环神经网络的一种。BiLSTM-CRF方法是基于双向长短时记忆网络和条件随机场(Conditional Random Fields,CRF)的结合算法,它通过结合BiLSTM和CRF来提高语言处理任务的准确性[25]。在BiLSTM-CRF模型中,如果直接将BiLSTM输出的标签概率作为最终的预测结果,可能会出现识别结果语序上的错误,例如可能会出现诸如I作为开头的词、存在两个连续的B的词、B-Event(事件开头部分)和I-LOC(内涝点中间部分)连在一起等的情况,如标签为Event的 “上千人被困”,其B-Event为“上”,标签为Loc的“郑州航院龙子湖校区”,其I-Loc可能为“州”,“上”和“州”连在一起不符合识别规则,使模型识别效果降低。而CRF层可以通过学习数据集中标签之间的转移概率从而修正BiLSTM层的输出,从而保证预测标签的合理性。
图2所示,利用BiLSTM-CRF模型提取城市内涝点,自下而上分别为数据输入层、向量表示层、BiLSTM层、CRF约束层、结果输出层。其基本思想是将微博文本数据划分为单个字符并输出一个向量,然后将向量输入到BiLSTM层学习上下文信息,最后按照逆序分别对句子进行采样,输出文本数据中所提到的城市内涝点信息。CRF层为最后预测的标签添加一些约束确保序列标注的有效性。
图2 BiLSTM-CRF结构

Fig. 2 Structure diagram of BiLSTM-CRF

2.3 最优路径推荐方法

由于微博文本数据形式复杂多样,用户表述不一致造成内涝点可视化结果冗余,给用户带来视觉干扰,不利于用户在紧急情况下寻路。因此生成道路网级别的城市内涝地图,并结合最短路径算法为用户推荐突发事件下的最优路径。
现有大多数导航系统利用最短路径算法生成街道网络中的起点和目的地之间的路线,如Dijkstra[26]或A*[27]最短路径算法。Dijkstra算法是基于一个简单的图结构,只需要距离信息来生成最短路径,用于计算有权图中从单个源点到其他所有顶点的最短路径的算法[28],使用广度优先搜索的思想,通过维护一个距离表来记录起始节点到其他节点的最短距离,并根据当前已知的最短距离选择下一个扩展的节点。A*算法是一种启发式搜索算法,与Dijkstra算法不同,A*算法考虑每个节点的启发式估计值(从当前节点到目标节点的估计距离),并使用这个估计值来指导搜索过程,是一种基于深度优先和广度优先的融合算法。然而,启发式函数的设计和调整可能会比较复杂,且在某些情况下可能引导搜索进入不必要的路径。Dijkstra算法则没有启发式函数,因此避免了在函数设计和调优上的复杂性。因此,本文利用Dijkstra算法计算出在特定条件下的最佳行进路径,
基于收集到的地理数据和实时情报,如表1所示,以简单的图结构为例,以A为顶点,依次计算到B-F 5个顶点的距离。当发生紧急事件时,有些路段无法通行,如BE视为障碍路段,所以将其从图结构中剔除,重新规划路线,其中明显发生变化的是从A到E和F的距离,由于图结构的调整,最短路径也随之更新。用户可以根据推荐的最优路径选择合适的行进方向,提高应对灾害的效率和安全性。当洪水发生时,如图3所示,根据语义信息识别到危险区域,使用Dijkstra算法为用户推荐避开危险区域的路径,其目的是推荐最优路径,这不仅方便了用户,在一定程度上也避免了交通堵塞。
表1 Dijkstra算法计算示例

Tab. 1 Example of Dijkstra algorithm calculation

图结构 起点 终点 最短路径 长度
A B {A,B} 1
C {A,B,E,C} 8
D {A,B,D} 4
E {A,B,E} 3
F {A,B,E,F} 7
A B {A,B} 1
C {A,B,D,C} 8
D {A,B,D} 4
E {A,B,D,C,E} 13
F {A,B,D,C,E,F} 17
图3 灾害应急导航示意

Fig. 3 Disaster emergency navigation map

3 实验设计与结果分析

3.1 实验设置与模型评价标准

3.1.1 实验环境与模型参数

使用BiLSTM-CRF模型实现地理命名实体识别,模型参数设置具体为:词向量嵌入维度为70,隐藏层输出维度为 128,输出向量维度为31,学习率为0.000 01,训练次数为100次。模型训练按照7:3的比例划分为训练集和测试集,其中训练集约12万字,测试集约5万字,实验环境配置如表2所示。
表2 实验环境配置

Tab. 2 Experimental environment configuration

名称 配置信息
操作系统 Windows 10
开发语言 Python 3.6
框架 PyTorch 1.10.2
GPU NVIDIA RTX 3060 (12 G)
内存 32 G

3.1.2 评价指标

地理命名实体识别方法的评价标准是基于准确率P、召回率RF1值作为识别模型方法的评价指标,同时也是信息搜索,知识分类、实体识别等领域评价模型的基本指标。其中准确率Р代表对命名实体识别结果的预测准确程度。召回率R代表原始数据中是实体名称而且被准确识别为实体名称的概率。计算方法如下所示:
P = T P T N × 100 %
R = T P N × 100 %
F 1 = 2 P × R P + R × 100 %
式中: TP代表预测正确的实体名称个数; TN代表预测出的所有实体名称个数; N代表标注的实体总个数。

3.2 实验场景

2021年7月20日,河南省郑州市持续遭遇极端特大暴雨,这次暴雨在短时间内达到600 mm以上的降水量,导致城市内涝严重,造成了巨大的灾害损失和人员伤亡。本文选择郑州市为研究区域,主要考虑到以下几个因素:
(1)郑州720特大暴雨是近年来中国内陆城市发生的罕见事件之一,造成的灾害影响十分严重,且对城市内涝防治研究提供了珍贵的实验数据和研究案例。
(2)本文旨在通过社交媒体数据的收集和处理,为城市内涝防治提供一种实时制作且刚好够用的制图方法,而本次特大暴雨恰好提供了一个应用场景,对研究方案和技术实现的有效性和可行性进行了充分的验证。
(3)河南省地处中国中东部和黄河中下游,气候具有较强的过渡性。由于气候转型明显,受季风影响较大,天气变化较为剧烈,降水总体集中在7、8、9月,灾害性天气较为常见。因此本研究也具有一定的应用意义,可以为城市规划和防汛减灾提供一定的参考。
在本研究中,不需要具有精确坐标的地理参考文本数据。首先,使用Selenium的WebDriver API,建立与浏览器的连接;然后,访问微博网站,通过WebDriver对象,指定要访问的微博网站的URL,从而打开相应页面;最后,模拟用户操作,例如搜索关键词、时间段、点击等操作。在微博上根据时间点获取的文本数据,采用关键词“#河南郑州暴雨#”关键词进行模糊查询,通配符为“#”,用于包括“郑州暴雨”或“郑州暴雨互助”的其他变体,使用这种方法,筛选关于需要积水内涝的帖子,共收集到6 300条微博文本数据,其中2021年7月20日3 000条文本数据,2021年7月21日3 300条文本数据。

3.3 城市内涝点提取结果

3.3.1 训练结果

使用已训练好的模型进行内涝点识别,根据输出的标记序列识别出文本中的内涝点。模型测试结果如表3所示,预测出正确的实体名称个数为 45 719,预测出所有的实体名称个数为49 304,所有标注的实体名称个数为50 024,依据式(1)—式(3)分别计算出实验训练整体准确率为92.7%,召回率91.4%,F1值为92.1%。使用该模型对实体识别的预测准确程度较高,能够较为准确地识别出内涝点。
表3 实验测试结果

Tab. 3 Experimental test results

预测出正确的实体名称数/个 预测出的所有实体名称数/个 所有标注的实体数/个 准确率/%
P 45 719 49 304 92.7
R 45 719 50 024 91.4
F1 92.1

3.3.2 预测结果

根据模型的训练结果,选取2021年7月20日和21日的微博文本数据,模型自动识别出文本中所包含的地名地点,识别效果示例如图4所示,最终输入文本文件,识别结果以csv文件方式输出。
图4 微博文本数据内涝点识别效果示例

Fig. 4 Example of identifying waterlogging points in weibo text data

3.3.3 地理编码可视化

基于上述识别结果,需要通过地理编码识别出洪水位置,所以需要将文本信息转换为经纬度坐标。从7月20日至21日的微博文本数据中总共提取到450个内涝点地区(包含重复的地名)。根据获取到的文本数量,由于7月21日提取到的城市内涝点明显增多,因此将7月21日的数据分为0:00—12:00和12:00—23:00时2个时间段,在这2个时间段内分别提取内涝点。图5为郑州市内涝点空间化示例,分别为2021年7月20日,7月21日0:00—12:00时和12:00—23:00时的城市内涝点分布图。
图5 郑州市内涝点可视化结果

Fig. 5 Visualization results of waterlogging points in Zhengzhou city

3.4 与官方发布的积水点对比

为了验证从社交媒体中提取结果的准确性,获取到官方发布的2021年7月19日至7月23日河南省郑州市积水点分布数据,数据来源于国家科技基础条件平台—国家地球系统科学数据中心(http://www.geodata.cn/index.html)。如图6所示,官方发布的积水点共有47个,积水点集中分布在郑州市北部,且从微博文本中提取到的城市内涝点与官方数据中大部分的积水点大致重合,由于人们对内涝位置的描述有详有略,导致地理编码位置不太准确,所以定位有所偏差。但总体来看,从微博文本中提取的城市内涝点与官方发积水点的空间分布基本一致。通过与官方数据的对比表明,利用该方法从大量的社交媒体数据中提取出的城市内涝点可以为城市灾害信息的监测提供补充和参考信息。
图6 官方发布积水点对比

Fig. 6 Comparison of official waterlogging points

3.5 最优路径推荐

通过地理编码的方式可以快速将城市内涝点展现在地图上,但微博文本数据形式复杂,如果用户描述的是同一个地方,由于用户表述的差异性,在地理编码后显示的空间信息有所差异,例如“郑州市东明路45号佳艺花园2号楼3单元二楼”和“郑州市东明路45号佳艺花园”描述的是同一个地方,前者得到的是精确坐标,后者定位结果为小区中心坐标,不同的表述导致可视化结果不一致,造成可视化信息冗余,给用户带来视觉干扰。
基于以上问题,为了弥补城市内涝点可视化信息冗余的不足,生成城市道路网级别的内涝地图,以更加直观的方式展现出涝点位置,为用户的寻路提供更加便捷式的服务。从OpenStreetMap ( https://stackshare.io/openstreetmap)上下载郑州市道路网数据,利用ArcGIS平台生成城市道路网,建立城市道路网级别的城市涝点地图,具体步骤为:根据识别到的城市内涝点建立500 m缓冲区,求出与城市道路网相交的部分,继而得到被洪水淹没的路段信息,为用户寻路提供参考信息,也为推荐最佳路径奠定基础。
图7所示,红色突出显示路段视为危险路段,通过右侧的局部内涝图可以看到,城市内涝的路段集中分布在居民区,给居民的出行带来诸多不便。因此实时显示的城市内涝点,通过形成道路网级别的城市内涝地图,可有效缓解地图信息冗余的问题,对于救援人员来说,实时更新的洪涝地图,有利于制定救援策略;对灾害点居民来说,方便其施行互助措施。
图7 道路网级别的城市内涝地图

Fig. 7 Map of urban waterlogging points at road network level

结合自然语言处理和最短路径推荐,将识别出的不同时段的城市涝点路段视为障碍路段,为用户推荐一条耗时最短、更为安全的道路。如图8所示,自上而下分别为即城市内涝点、涝点缓冲区、城市道路网和在线地图,4个图层叠加生成道路网级别的城市涝点地图,结合最短路径推荐技术,可以为用户提供导航微地图服务。用户通过选择出发点和目的地,系统会自动推荐一条避开危险路段的最佳路径。同时,用户可结合实时的涝点地图以及推荐路径微参考,绘制自己熟知的最佳路径,并分享给他人,不仅提高了地图的交互共享性,而且提高了微地图的传播价值。
图8 在线地图实时生成显示涝点路段

Fig. 8 Real-time generation of online map to display waterlogged road sections

3.6 微地图场景应用

为了验证此方法的可行性,将其应用到实际场景当中。具体操作步骤为:以在线高德地图(https://www.amap.com/)为底图,用户根据需要选择特定时间段和特定主题的文本数据,自动获取到文本数据并将识别结果自动化显示到地图中,同时会显示出被洪水淹没的路段,然后用户通过选择出发点和目的地,系统会推荐一条最佳路径。如果需要自己绘制地图,可根据实时生成的涝点地图与推荐路径为参考信息,结合自身场景绘制地图,并且分享给他人。如图9所示,图9(a)中显示出识别的城市内涝点,基于图9(a)生成图9(b)显示出洪水淹没的路段,然后为用户推荐最短路径。经过对比发现,图9(c)虽然推荐的是最短路径,但是在用户不知情的情况下按照此路线可能会遇到洪水导致无法通行从而耽误更多的时间,图9(d)是微地图推荐的最短路径,虽然不是路径最短,但是避开了危险区域,因此以最低成本(时间,路径)到达目的地是用户最期望的效果。以这种方式绘制的地图能够体现出微地图“微内容”的特点,即地图内容刚好够用而不冗余,保证了地图内容与用户需求的一致性,从而更有利于地图的高效传播。对于出行的居民,如果根据导航提示,显示突发事件的信息,推荐最低成本的路径,即最优路径。所以此方法可以提醒用户避开洪水路段,在一定程度上避免了交通堵塞,更有利于用户将其作为参考信息绘制灾害微地图。
图9 应急导航微地图

Fig. 9 Emergency navigation we-map

为了满足多用户的需求,根据用途可将城市内涝场景下绘制的地图赋予不同的标签,例如回家最近路线、救援地图、驾驶地图、步行地图、暴雨互助地图、最近救援物资地图等。一张地图至少赋予一个标签,不仅方便其他用户的精准查找与使用,同时也为城市救援行动提供一定的参考价值。

4 讨论

社交媒体作为人们实时分享信息的平台,通过发布文本信息来描述内涝现象,分享实际情况和求助信息。高效实时地获取灾害数据,可以帮助大众实时掌握灾害现场信息,有助于提高灾害的实时响应与监测。本文提出的一种基于微博文本数据在城市内涝场景下生成微地图的方法,通过“数据获取—内涝点提取—最优路径推荐—地图制作”的流程,利用NLP技术提取内涝信息并推荐最佳行进路线,帮助与用户在寻路的同时绘制微地图,为后续寻路用户提供支撑和帮助。此方法解决了灾情信息获取滞后的不足,提高了地图制作的现势性,且有效避免了地理信息过度冗余的问题。
与传统的制图方法相比(表4),传统的制图方法数据获取主要依赖于遥感影像和水位监测站,由专业制图人员统一制图,单向传播给用户。用户被动接收信息,由于专业制图人员制图过程中所表达的专业的地理信息内容可能不是用户想要的信息,从而导致地理信息冗余,造成读图中断。此外,尤其是高精度遥感影像不仅获取周期长,而且由于天气条件、云雾遮挡等因素导致数据质量无法保证。同时,由于城市经济条件、地形等因素限制,水位监测站覆盖范围有限,无法均匀分布到城市各个角落,数据获取成本高。而社交媒体数据正好补充了传统检测方法数据的不足,其提供了实时、全面多样化且低成本的数据来源,有助于更好地了解内涝事件的发生和影响,进而指导紧急响应和灾害管理工作。用户根据自己的观察和经验发布的信息构成众包地理数据,数据覆盖范围广泛。且实时提取的地理信息有助于实时掌握灾害信息,在此基础上为用户提供导航服务,辅助非专业用户绘制简单的微地图用户根据显示信息简单绘制自己想要的信息,从而可以有效避免地理信息冗余的问题。
表4 传统制图方法与微地图制图方法对比

Tab. 4 Comparison between conventional mapping and we-map mapping methods

传统制图方法 微地图制图方法
数据来源 遥感影像、水位监测站 社交媒体文本数据
覆盖范围 有限 广泛
表达地理信息内容 专业、冗余 简单、有针对性
制图周期
制图对象 专业制图人员 专业制图人员、非专业制图人员
传播方式 点到点,点对多 多对多
获取信息时效性
地图制作现势性
制图成本
尽管利用社交媒体数据可以实时提取城市内涝点并辅助用户寻路,但是利用社交媒体数据制图结果的验证存在一定困难,正如图6所示,利用官方发布的积水点进行对比,发现提取结果与大部分官方积水点重叠,但也存在不重合的积水点。因此,利用社交媒体数据进行洪水制图并非要代替传统的监测手段,而是为传统监测数据提供有力的补充信息,为城市内涝监测和防灾工作提供有价值的参考。未来研究工作中会将社交媒体数据作为其中的一个信息源,与其他数据源(如气象数据、水位数据等)相结合,共同形成全面的内涝识别模型,通过多因素综合分析,提高内涝点的识别效果和准确性,可以更准确地评估内涝风险和预测内涝发生的可能性。

5 结论

社交媒体数据作为灾害突发事件的数据来源之一,在城市内涝方面具有多重作用,不仅可以提供实时的内涝情况信息,还可以为内涝风险评估、城市规划和决策制定等方面提供有力支持,促进城市内涝的科学化和精细化管理。相比于传统的气象观测设备,社交媒体数据更新迅速,可以提供更及时的信息。大众参与能够丰富内涝场景的描述,同时也促进了公众与城市管理部门之间的互动和信息共享。
基于此,本文提出了一种在城市内涝场景下的制图方法。以“郑州7.20特大暴雨”为案例,对于实时获取的微博文本数据,分时段有效地识别出海量文本信息中所含的城市内涝点,赋予地理空间信息。在此基础上,生成道路网级别的城市内涝地图,结合Dijkstra算法推荐应急场景下的最优路径,辅助用户寻路并生成微地图。获取实时灾情信息,为用户提供灾害应急情况下的微地图导航服务,不仅有利于调动用户的积极性参与制图,也能为决策者合理分配应急资源以及及时应对和处理突发事件提供辅助。
根据社交媒体文本信息制作微地图可以实时捕捉内涝事件的发生和演变过程,能够帮助城市管理部门更快速地了解内涝情况,及时采取应对措施,从而减轻灾害损失。但是社交媒体上的文本数据往往带有主观性和不确定性,后续研究将通过建立模型对文本数据进行有效地分类并判断文本内容的正确性,提高数据的可用性。
本文图文责任编辑:蒋树芳
[1]
张冬冬, 严登华, 王义成, 等. 城市内涝灾害风险评估及综合应对研究进展[J]. 灾害学, 2014, 29(1):144-149.

[Zhang D D, Yan D H, Wang Y C, et al. Research progress on risk assessment and integrated strategies for urban pluvial flooding[J]. Journal of Catastrophology, 2014, 29(1):144-149.] DOI:10.3969/j.issn.1000-811X.2014.01.026

[2]
周延, 佘敦先, 夏军, 等. 基于水文水动力模型的LID措施对城市内涝风险的影响研究[J]. 武汉大学学报(工学版), 2022, 55(11):1090-1101.

[Zhou Y, She D X, Xia J, et al. Study on the impact of LID practices on urban waterlogging risk based on hydrohydrodynamic coupling model[J]. Engineering Journal of Wuhan University, 2022, 55(11):1090-1101.] DOI:10.14188/j.1671-8844.2022-11-002

[3]
Liu Y, Liu X, Gao S, et al. Social sensing: A new approach to understanding our socioeconomic environments[J]. Annals of the Association of American Geographers, 2015, 105(3):512-530. DOI:10.1080/00045608.2015.1018 773

[4]
吴建华, 胡烈云, 赵宇, 等. 基于BiLSTM-CRF与分类分层标注的微博中突发事件时空信息精细识别方法[J]. 地理与地理信息科学, 2021, 37(3):1-8.

[Wu J H, Hu L Y, Zhao Y, et al. Method of finely identifying spatio-temporal information of emergencies from weibo based on BiLSTM-CRF and classified-hierarchical annotation[J]. Geography and Geo-Information Science, 2021, 37(3):1-8.] DOI:10.3969/j.issn.1672-0504.2021.03.001

[5]
闫浩文, 张黎明, 杜萍, 等. 自媒体时代的地图:微地图[J]. 测绘科学技术学报, 2016, 33(5):520-523.

[Yan H W, Zhang L M, Du P, et al. We-map: A new type of map in the era of we media[J]. Journal of Geomatics Science and Technology, 2016, 33(5):520-523.] DOI:10.3969/j.issn.1673-6338.2016.05.015

[6]
白娅兰, 闫浩文, 禄小敏, 等. 微地图符号的视觉变量及其应用[J]. 测绘科学, 2021, 46(7):182-188,204.

[Bai Y L, Yan H W, Lu X M, et al. Visual variables of We-Maps symbols and their applications[J]. Science of Surveying and Mapping, 2021, 46(7):182-188,204.] DOI:10.16251/j.cnki.1009-2307.2021.07.025

[7]
闫晓婧, 闫浩文, 王小龙, 等. 微地图符号的智能化匹配——“识图配符”[J]. 测绘科学, 2022, 47(10):205-212.

[Yan X J, Yan H W, Wang X L, et al. An intelligent symbol matching solution for we-maps through image recognition[J]. Science of Surveying and Mapping, 2022, 47(10):205-212.] DOI:10.16251/j.cnki.1009-2307.2022.10.027

[8]
何阳, 闫浩文, 王卓, 等. 面向微地图的地标提取方法及个性化寻路应用[J]. 地球信息科学学报, 2022, 24(5):827-836.

DOI

[He Y, Yan H W, Wang Z, et al. Landmark extraction method and personalized wayfinding application for we-map[J]. Journal of Geo-Information Science, 2022, 24(5):827-836.] DOI:10.12082/dqxxkx.2022.210376

[9]
Wang X L, Yan H W, Gao S, et al. We-map orientation method suitable for general public with weak sense of orientation[C]// International Conference on Spatial Data and Intelligence. Cham: Springer, 2022:35-41. DOI:10.1007/978-3-031-24521-3_3

[10]
朱晓寒, 李向阳, 刘昭阁. 大数据环境下城市内涝灾害的情景维度模型构建[J]. 武汉大学学报·信息科学版, 2020, 45(11):1818-1828.

[Zhu X H, Li X Y, Liu Z G. Constructing scenario dimension model of city waterlogging under big data environment[J]. Geomatics and Information Science of Wuhan University, 2020, 45(11):1818-1828.] DOI:10.13203/j.whugis20190225

[11]
邬柯杰, 吴吉东, 叶梦琪. 社交媒体数据在自然灾害应急管理中的应用研究综述[J]. 地理科学进展, 2020, 39(8):1412-1422.

DOI

[Wu K J, Wu J D, Ye M Q. A review on the application of social media data in natural disaster emergency management[J]. Progress in Geography, 2020, 39(8):1412-1422.]

DOI

[12]
曹建成, 王凯, 郭朝阳. 天地图客户端自助制图技术研究[J]. 测绘通报, 2016(9):123-126,132.

DOI

[Cao J C, Wang K, Guo C Y. Research on the self-mapping technology on the map world(TianDiTu) client[J]. Bulletin of Surveying and Mapping, 2016(9):123-126,132.] DOI:10.13474/j.cnki.11-2246.2016.0310

[13]
李素菊. 多方联动实景制图机制介绍[J]. 中国减灾, 2018(23):58-59.

[Li S J. Introduction of multi-party linkage real-life mapping mechanism[J]. Disaster Reduction in China, 2018(23):58-59.] DOI:10.3969/j.issn.1002-4549.2018.23.021

[14]
任福, 严涵, 龚丽芳, 等. 多空间尺度的灾害应急动态制图规则[J]. 测绘地理信息, 2020, 45(3):1-7.

[Ren F, Yan H, Gong L F, et al. Disaster emergency dynamic mapping rules on multiple spatial scale[J]. Journal of Geomatics, 2020, 45(3):1-7.] DOI:10.14188/j.2095-6045.2019208

[15]
伍智超, 王超, 李秉清, 等. 基于社交媒体数据的武汉内涝时空统计分析[J]. 测绘地理信息, 2022, 47(5):89-92.

[Wu Z C, Wang C, Li B Q, et al. Spatiotemporal statistical analysis of waterlogging in Wuhan based on social media data[J]. Journal of Geomatics, 2022, 47(5):89-92.] DOI:10.14188/j.2095-6045.2020329

[16]
王艳东, 李昊, 王腾, 等. 基于社交媒体的突发事件应急信息挖掘与分析[J]. 武汉大学学报·信息科学版, 2016, 41(3):290-297.

[Wang Y D, Li H, Wang T, et al. The mining and analysis of emergency information in sudden events based on social media[J]. Geomatics and Information Science of Wuhan University, 2016, 41(3):290-297.] DOI:10.13203/j.whugis20140804

[17]
佟金萍, 张涵玥, 刘辉, 等. 基于XGBoost的长三角核心城市内涝风险评估及影响因素分析[J]. 水利水电技术(中英文), 2021, 52(10):1-11.

[Tong J P, Zhang H Y, Liu H, et al. XGBoost model-based risk assessment and influencing factors analysis of waterlogging in core cities of Yangtze River Delta[J]. Water Resources and Hydropower Engineering, 2021, 52(10):1-11.] DOI:10.13928/j.cnki.wrahe.2021.10.001

[18]
周锐. 基于社交媒体的城市内涝灾害信息实时挖掘与分析[D]. 武汉: 华中科技大学, 2021.

[Zhou R. Real-time mining and analysis of urban waterlogging disaster information based on social media[D]. Wuhan: Huazhong University of Science and Technology, 2021.] DOI:10.27157/d.cnki.ghzku.2021.004621

[19]
Doulamis N D, Doulamis A D, Kokkinos P, et al. Event detection in twitter microblogging[J]. IEEE Transactions on Cybernetics, 2016, 46(12):2810-2824. DOI:10.1109/TCYB.2015.2489841

PMID

[20]
Siti A A, Zaheera Z A, Halizah B, et al. An intelligent crisis-mapping framework for flood prediction[J]. International Journal of Recent Technology and Engineering, 2019, 8(2S8):1304-1310. DOI:10.35940/ijrte.b1058.0882s 819

[21]
王荩梓. 社交媒体中城市内涝信息提取与分析[D]. 上海: 华东师范大学, 2020.

[Wang J Z. Urban waterlogging information extraction and analysis using social media[D]. Shanghai: East China Normal University, 2020.] DOI:10.27149/d.cnki.ghdsu.2020.000280

[22]
Zhang Y, Chen Z Q, Zheng X, et al. Extracting the location of flooding events in urban systems and analyzing the semantic risk using social sensing data[J]. Journal of Hydrology, 2021,603:127053. DOI:10.1016/j.jhydrol.2021.127053

[23]
叶鹏, 张雪英, 张春菊. 基于微博文本的灾害事件信息时空过程聚合方法[J]. 测绘学报, 2023, 52(3):490-500.

DOI

[Ye P, Zhang X Y, Zhang C J. Spatio-temporal process based information aggregation method of disaster events in microblog text[J]. Acta Geodaetica et Cartographica Sinica, 2023, 52(3):490-500.] DOI:10.11947/j.AGCS.2023.20210496

[24]
王国昱. 基于深度学习的中文命名实体识别研究[D]. 北京: 北京工业大学, 2015.

[Wang G Y. Research of Chinese named netity recognition based on deep learning[D]. Beijing: Beijing University of Technology, 2015.]

[25]
程博, 李卫红, 童昊昕. 基于BiLSTM-CRF的中文层级地址分词[J]. 地球信息科学学报, 2019, 21(8):1143-1151.

DOI

[Cheng B, Li W H, Tong H X. Chinese address segmentation based on BiLSTM-CRF[J]. Journal of Geo-Information Science, 2019, 21(8):1143-1151.] DOI:10.12082/dqxxkx.2019.180654

[26]
Dijkstra E W. A note on two problems in connexion with graphs[J]. Numerische Mathematik, 1959, 1(1):269-271. DOI:10.1007/BF01386390

[27]
Hart P E, Nilsson N J, Raphael B. A formal basis for the heuristic determination of minimum cost paths[J]. IEEE Transactions on Systems Science and Cybernetics, 1968, 4(2):100-107. DOI:10.1109/TSSC.1968.300136

[28]
Nuhn E, Timpf S. Do people prefer a landmark route over a shortest route?[J]. Cartography and Geographic Information Science, 2022, 49(5):407-425. DOI:10.1080/15230406.2022.2075469

文章导航

/