Ontology Modeling of Marine Environmental Disaster Chain for Internet Information Extraction: A Case Study on Typhoon Disaster

  • JIA Mengshu , 1, 2 ,
  • ZHANG Yu , 1, * ,
  • PAN Tingting 1, 2 ,
  • WU Wenzhou 1, 3 ,
  • SU Fenzhen 1, 3
Expand
  • 1. State Key Laboratory of Resources and Environmental Information System, Institute of Geographic Sciences and Natural Resources Research, Chinese Academy of Sciences, Beijing 100101, China
  • 2. University of Chinese Academy of Sciences, Beijing 100049, China
  • 3. Collaborative Innovation Center of South China Sea Studies, Nanjing University, Jiangsu, Nanjing 210023, China
* ZHANG Yu, E-mail:

Received date: 2019-12-11

  Request revised date: 2020-03-31

  Online published: 2021-02-25

Supported by

National Key Research and Development Program of China(2017YFC1405302)

Copyright

Copyright reserved © 2020

Abstract

Global climate change has increased the impact and destructive power of marine environmental disasters. Real-time disaster information acquisition and analysis have become a key process in disaster emergency response. Compared with traditional earth observation network with delay effect, the crowdsourcing geographic information based on the Internet has been widely valued in disaster situation assessment and emergency response for its real-time nature. Marine environmental disasters include not only one single disaster but also a series of secondary and derived disasters caused by a single disaster. The latter are the extension and expansion of a disaster across the space and time dimensions, which continue to affect human activities. The analysis of a single disaster is difficult to fully explain the temporal and spatial evolution of a disaster to further explore its scope and degree of impact. In order to obtain information on marine environmental disasters implied in the Internet texts and explore the impact of disasters on human activities, this article builds a marine environmental disaster chain ontology based on collected marine environmental disaster-related knowledge and using five-tuples (concepts, relationships, properties, rules, and instances) to represent the logical structure of the ontology, which integrates the marine environmental disaster ontology describing the marine environmental disaster knowledge system, the geographical object ontology affected by the marine environmental disasters, and the corresponding human emergency ontology generated from the spatiotemporal processes of a disaster's occurrence, development, and end together. This article not only analyzes the concept of marine environmental disasters from the perspective of geographical events but also focuses on the characteristics of temporal and spatial processes of the development of marine environmental disasters. Many factors involved in the development of disasters from the perspective of the disaster chain are also analyzed. Thus, our paper breaks through the limitation of using a single disaster to represent the entire disaster process in traditional analysis and comprehensively analyzes the disaster process-related information. Finally, this article takes typhoon disaster as an example based on the typhoon disaster chain to illustrate the disaster information extraction from the Internet texts and analyze the spatiotemporal changes of typhoon disaster, so as to provide effective support for disaster prevention and emergency response.

Cite this article

JIA Mengshu , ZHANG Yu , PAN Tingting , WU Wenzhou , SU Fenzhen . Ontology Modeling of Marine Environmental Disaster Chain for Internet Information Extraction: A Case Study on Typhoon Disaster[J]. Journal of Geo-information Science, 2020 , 22(12) : 2289 -2303 . DOI: 10.12082/dqxxkx.2020.190765

1 引言

海洋环境灾害一般是发生在近海区域的,由自然/社会环境因素引发的,对沿岸生态环境、社会经济等造成一定威胁或损失的现象。传统以观测站、卫星、航空、航天、浮标等为代表的对地观测网络一般难以满足灾害监测与灾情评估的实时性需求,而以泛在互联网空间信息为代表的众包地理信息由于其实时性、易获取性等优势成为灾害监测与评估的重要补充[1],从而形成针对海洋环境灾害的较全面感知。然而,海洋环境灾害所产生的影响不是单一灾种作用下的结果,而是由多灾种共同作用导致,一般由一个灾种诱发一连串的次生/衍生灾害,即形成灾害链。基于灾害链的互联网灾害信息抽取将会为灾情评估与应急处置提供重要的科学依据,其基础在于构建海洋环境灾害知识体系,建立多灾种间的相互关联,从而全面探究灾害时空变化趋势及其对人群行为活动的影响。
海洋环境灾害知识体系的建立一般以本体为基础,通过建立本体概念、关系、属性、约束等知识间的相互关系,形成对海洋环境灾害知识的显式化表达。本体作为共享概念模型的明确的形式化规范说明[2],在信息集成和文本挖掘方面具有的重要作用日益显现[3],涉及数据组织[4,5,6]、数据检索[7,8,9]、知识建 模[10,11]等方面。为提高海量分布式海洋灾害数据 集的共享性和交互性,朱国琴等[12]建立海洋灾害领域本体,并以此为指导构建海洋灾害数据库。Yang等[13]以台风为研究对象,构建了分层的、形式化的台风本体,并据此人工识别了几种典型的台风灾害链模式。鉴于不同来源的本体知识体系对概念及关系等描述具有较大差异,需实现知识体系的有效融合以降低本体建模成本,因而领域知识重用成为本体知识建模的一个重要方面[14],当前较著名的领域本体有Geo Linked Data[15]、SWEET(Semantic Web for Earth and Environmental Terminology)[16]、DBpedia[17]等,以此可为特定领域本体知识建模提供基本语义框架。海洋环境灾害链本体建模不仅在于灾害知识的逻辑表达,更在于潜在灾害关系的显式化,即以灾害链显式化描述灾害的发展变化过程及其影响,从而探究灾前、灾中和灾后一系列相关事件的时空变化特征及其影响下的人群行为活动。然而,当前针对灾害事件的本体建模仅描述单一灾害信息,忽略了由其引发的一系列次生/衍生灾害,因而难以形成针对灾害过程的全面分析,以准确评估其影响范围及程度。因此,急需在现有灾害本体知识重用的基础上,构建面向海洋环境灾害链的本体知识框架,以支持基于互联网的灾害信息抽取与分析。
鉴于基于单一灾种的本体建模在海洋环境灾害描述中的局限性,难以有效支持互联网隐含灾害信息抽取,因而未能全面探究灾害时空变化过程及其影响。为此,本文结合现有海洋环境灾害知识体系,构建了用于互联网信息抽取的海洋环境灾害链本体框架,实现了灾害知识的形式化表达;在此基础之上,借助于自然语言处理技术,实现了面向互联网文本的台风灾害信息抽取与分析,并展示台风灾害的时空变化及其影响。

2 海洋环境灾害链概念分析

面向事件的地理本体建模是以地理事件为核心,借助本体实现相关概念的形式化表达,从而支持地理信息抽取与知识发现[18,19]。地理事件是在地理空间领域发生的各种自然和社会现象,由时间、位置和现象等组成[20],其本质上是由其内在的固有因果过程和外在的偶然因素共同作用产生的时空结果差异,即,地理现象具有时空过程特征,其描述和表达必须考虑时间过程问题[21]。灾害链是指因一种灾害发生而引起的一系列灾害发生的现象,可以进一步分为串发性灾害链和并发性灾害链。海洋环境灾害链可以看作是地理事件的一个子集,仍可采用面向事件的本体建模思想,形成围绕海洋环境灾害的知识体系与形式化表达,其中不仅包含海洋环境灾害知识体系,同时包含海洋环境灾害作用下的地理对象的知识体系,通常引起地理对象在空间(如位置、形态)和属性(如面积、行为)上发生变化,以及灾害发生发展过程中对周边区域所产生的影响及响应的人类应急处置知识体系。因此,海洋环境灾害链本体建模涉及海洋环境灾害本体建模、地理对象本体建模以及人类应急处置本体建模3个部分(图1)。
图1 海洋环境灾害链本体

Fig. 1 Marine environmental disaster chain ontology

3 海洋环境灾害链本体建模

3.1 本体逻辑结构表达

本体逻辑结构化是将领域知识归纳到统一的语义框架下,从而建立知识描述间的相互关联,以支持信息抽取与推理。本体逻辑结构表达有多种形式,如三元组(概念、属性、实例)[22]、四元组(概念集、关系集、实例集与公理集)[4,23]和五元组(概念、关系、属性、规则和实例)[24]等。然而,三元组缺乏对概念间关系描述,因而难以支持知识推理以发现潜在的知识关联;四元组缺乏对属性的考虑,因而难以完整描述实例特征。本文认为五元组可满足对海洋环境灾害及其作用下地理对象知识的完整描述,因此采用五元组作为本体的逻辑结构框架,形成相关知识的统一描述,即表示为式(1)。
Onto = ( Con , Rel , Prop , Rule , Ins )
式中:Con表示概念,指一组具有相同属性的地理事物的总称;Rel表示关系,指地理概念之间、概念与实例间,以及实例之间的相互关联,包括空间关系与语义关系;Prop表示属性,分为对象和数据属性,对象属性表示个体间的关联性,而数据属性表示个体与数值间的关联性;Rule表示规则,指对地理属性取值范围、类型和组合方式的约束,以支持语义推理;Ins表示实例,是地理概念的具体表达。

3.2 本体建模方法

本体建模方法因应用目的而异,主要包括骨架法[25]、TOVE法[26]、Methontology法[27]和七步法[28]等。本文采用骨架法和七步法结合的方法建立海洋灾害链本体:① 定本体构建目的和领域范围,本文目的在于形式化表达海洋环境灾害知识,从而支持互联网灾害信息抽取及其时空变化分析,领域范围是海洋环境灾害;② 现有本体知识重用,检查现有本体中相关海洋灾害知识体系,以将其中一些概念、关系等整合到本体框架中;③ 列出重要术语,参考国家海洋环境灾害分类体系以及现有海洋领域知识,以较为全面地覆盖本领域的概念、关系与属性等;④ 定义本体中概念、关系、属性、约束和实例,主要采用自上而下和自下而上的综合方法,形成完整的海洋环境灾害知识框架;⑤ 本体评价,检验本体是否足以描述各类概念。本文将分别论述海洋环境灾害本体、地理对象本体以及人类应急处置本体建模过程。

3.3 海洋环境灾害本体建模

海洋环境灾害本体建模重点在于灾害分类与灾害间关系表达。海洋环境灾害分类主要依据《自然灾害分类与代码》[29]与《突发事件分类与编码》(GB/T 35561-2017)[30]中相关概念及其层次关系,同时考虑海洋环境灾害间的次生/衍生关系,建立海洋环境灾害概念与关系的基本描述。海洋环境灾害类别分为气象水文灾害、地质地震灾害、海洋灾害、生物灾害、生态环境灾害5大类,各类别又继续细分为小类,如海洋灾害可分为风暴潮灾害、海浪灾害、海冰灾害、海啸灾害和赤潮灾害等(表1)。
表1 海洋环境灾害分类

Tab. 1 Classification of marine environmental disasters

一级类 二级类
气象水文灾害 洪涝灾害、台风灾害、暴雨灾害、大风灾害、冰雹灾害、雷电灾害、低温灾害、冰雪灾害、大雾灾害等
地质地震灾害 地震灾害、火山灾害、滑坡灾害、泥石流灾害等
海洋灾害 风暴潮灾害、海浪灾害、海冰灾害、海啸灾害、赤潮灾害等
生物灾害 植物病虫害、疫病灾害、鼠害、草害、赤潮灾害等
生态环境灾害 水土流失灾害、风蚀沙化灾害、盐渍化灾害等
事故灾难 危险化学品事故、道路交通事故、水上交通事故、铁路交通事故、城市轨道交通事故、民用航空事故、基础设施和公共设施事故、环境污染和生态破坏事件、踩踏事件、核辐射事故、能源供应中断事故等
公共卫生事件 群体性中毒/感染事件、病原微生物/菌毒株事件等
社会安全事件 群体性事件、涉外突发事件、网络安全事件等
海洋环境灾害间除了具有类别层次关系外,还具有灾害间的诱发关系,从而形成灾害链。不同的灾害成灾机制和影响对象不同,因而所形成的灾害链各不相同。如台风可引发风暴潮、大风、暴雨等灾害,而暴雨又可引发滑坡、泥石流等灾害,最终造成房屋损毁、农田倒伏、基础设施损坏等影响,由此形成台风灾害链;海冰结冰状态下可形成作用力,引发船体、海上建筑、输油管道等损坏,还会阻隔氧气,进而使得海洋生物生长受到影响,形成海冰灾害链;赤潮会消耗水中溶解氧,并分泌毒素,使得海洋生物死亡,对生态环境和人类健康造成威胁,形成赤潮灾害链等。
概念和关系形成了海洋环境灾害本体的基础框架,属性、约束和实例则丰富了本体框架的基本内容。海洋环境灾害属性包括时空属性与非时空属性,需同时考虑各灾害通用属性信息与特有属性信息,部分属性如下表所示。海洋环境灾害约束主要限定属性取值范围,如受灾面积的取值范围不能为负。实例为本体知识的具体表述,以验证本体的有效性及描述的准确性(表2)。
表2 海洋环境灾害属性描述(部分)

Tab. 2 Description of marine environmental disasters’ properties (partial)

属性特征 属性内容 实例
通用属性 发生位置 hasOccurredLocation: 青岛
发生时间 …年…月…日 hasOccurredTime:2019年10月11日
特有属性 风速 …公里/小时(km/h) hasWindSpeed: 13km/h
风力等级 …级 hasWindLevel: 10级
潮位 …米(m) hasTideMark: 2.0 m
降雨量 …毫米(mm) hasRainFall: 100 mm
流速 ….公里/小时(km/h) hasFlowSpeed:10km/h

3.4 地理对象本体建模

海洋环境灾害作用下的地理对象本体建模涉及近海及其周边海岸带的诸多地理对象,其基本概念和关系制定所依据的参考标准主要是《基础地理信息要素分类与代码》[31]中概念及其层次关系,以及现有国家自然/社会区划中地名实体概念及其隶属关系。地理对象类别分为定位基础、水系、居民地及设施、交通、管线、境界与政区、地貌、植被与土质8大类,各类别又可继续细分,如水系可划分为河流、沟渠、湖泊、水库、海洋要素等类别(表3)。
表3 地理对象分类

Tab. 3 Classification of geographic objects

一级类 二级类
定位基础 测量控制点、数学基础
水系 河流、沟渠、湖泊、水库、海洋要素等
居民地及设施 居民地、工矿及其设施、农业及其设施、公共服务及其设施、名胜古迹、宗教设施、科学观测站等
交通 铁路、城际公路、城市道路、乡村道路、道路构造物及附属设施、水运设施、航道、空运设施等
管线 输电线、通信线、油/气/水输送主管道、城市管线
境界与政区 国外地区、国家行政区、省级行政区、地级行政区、县级行政区、乡级行政区等
地貌 等高线、高程注记点、水域等值线、水下注记点、自然地貌、人工地貌
植被与土质 农林用地、城市绿地、土质
地理对象关系描述包括空间关系描述与语义关系描述二方面:
(1)空间关系描述涉及拓扑关系、方位关系与度量关系描述3种。其中,拓扑关系包括包含、被包含、相接、相离、相等和相交6种基本关系,方位关系包括东、南、西、北、东南、西南、东北和西北8种基本关系,度量关系一般是对2个空间位置相对距离的度量。以胶州湾为例,拓扑关系表达为与青岛相接,且被黄海包含;方位关系表述为在青岛南部;度量关系以定性形式表述为与青岛相邻,以定量形式表述为“距日照100公里”。
(2)语义关系描述,主要针对概念间、概念与实例间,以及实例间关系的描述。最基本的语义关系包括父/子关系,指2个概念间的从属或上下义关系,如湖泊是水系的子类;整体/部分关系,是某个概念表述的地理对象是由多个其他概念表述的地理对象组成,如胶州湾属于黄海的一部分;互斥关系,是同级概念间及相同性质实例间的互斥关系,如青岛和日照间的互斥性;等价关系,是同级概念或实例间的等价关系,如青岛和琴岛代表相同的地理对象;实例关系,是概念与其实例间的关系,如胶州湾属于海湾的一个实例。另外,一些地理对象的属性特征会在海洋环境灾害的作用下发生变化,如地理对象的大小或形状发生改变,这种灾害与地理对象间的作用关系成为语义关系中的重要部分,可用于互联网文本知识发现以评估受灾情况。
除描述地理对象所涉及的概念与关系外,地理对象本体仍需添加属性、约束和实例知识以丰富其内容。地理对象属性仍划分为空间属性与非空间属性:前者包括时空形态、时空范围和时空尺度等语义描述,后者则需依据各地理对象特征赋予相应的语义描述(表4)。地理对象约束仍是对本体实例属性取值范围的限定,如对时空范围的限定。
表4 地理对象属性描述(部分)

Tab. 4 Description of geographic object's properties (partial)

属性特征 属性内容 实例
空间属性 形态描述 点/线/面 hasFormDescription: 面
数量描述 …米(m)/…平方米(m2 hasQuantityDescription: 200 m2
非空间属性 名称 hasName:南苑公园
所有单位 hasPossessor: 国家

3.5 人类应急处置本体建模

海洋环境灾害链本体还应描述灾害发生发展过程中对周边区域所产生的影响及响应。本文将其划分为灾害预防、灾害影响与响应,以及灾后恢复3部分(表5)。灾害预防是指在海洋环境灾害发生前对灾害事件的预测预防,可划分为个人防范措施以及政府防灾管控措施;灾害影响是指在海洋环境灾害发生过程中其对周边区域自然/社会环境造成的危害,可划分为生命安全影响、基础设施影响、社会活动影响、生态环境影响、经济影响等;灾害响应是指在海洋环境灾害发展过程中所采取的应急响应措施,可划分为启动应急动员、基础设施抢修、保护生命安全、保障基本生活等;灾后恢复是指海洋环境灾害发生后自然/社会环境的恢复措施及效果,可划分为卫生防疫、基础设施恢复、社会活动恢复、生态环境恢复、经济恢复等,各类别可继续细分为子类,如基础设施影响可继续划分为交通影响、供电设施影响、供排水设施影响、通信设施影响等,由此形成在灾害概念层次方面较为完整的表述。
表5 人类应急处置概念分类(部分)

Tab. 5 Classification of human emergency response concepts(partial)

灾害阶段 一级类 二级类
灾前 灾害预防 个人防范措施、政府防灾管控措施
灾中 灾害影响 生命安全影响、基础设施影响、社会活动影响、生态环境影响、经济影响等
灾害响应 启动应急动员、基础设施抢修、保护生命安全、保障基本生活等
灾后 灾后恢复 卫生防疫、基础设施恢复、社会活动恢复、生态环境恢复、经济恢复等
人类应急处置本体的时空属性主要用于标识应急处置事件发生的时间和位置,非时空属性则是对灾害影响与处置情景的描述,其中针对灾情相关词汇的描述则是灾害影响评估的重点,可依据该类词汇通过关键词匹配方式发现互联网中隐含的灾情信息,从而评估灾害对人群活动的影响(表6)。
表6 人类应急处置属性描述

Tab. 6 Description of human emergency response's properties

属性特征 属性内容 实例
发生位置 hasOccurredLocation: 广州
发生时间 …年…月…日 hasOccurredTime: 2019年8月18日
造成伤亡 …人 hasCauseCasualty: 600人
经济损失 …万元 hasEconomicLoss: 100 万元
人员转移 …人 hasPersonnelTransfer: 700人
受灾面积 …平方公里(km2 hasAffectedArea: 800 km2
灾情词汇描述 hasDescription:停水/供水中断

4 应用案例

4.1 数据源

本文应用案例的数据源分为3个部分。首先从新浪微博中爬取了时间范围在2018年9月16日至2018年9月18日内,台风“山竹”相关的727篇文本数据;其次,根据台风灾害链,为尝试提高信息抽取精度,本文进一步收集整理了该时间段内有关“暴雨”的新浪微博1583篇、“风暴潮”的新浪微博459篇;最后,为了对台风信息抽取结果的可靠性进行评价,获取地面观测数据进行分析作为对比,以暴雨为例,从中国气象数据网(http://www.nmic.cn/)获取了相同时间段内中国地面降水日值0.5°×0.5°格点数据集(V2.0)。

4.2 实验过程

本文采用OWL DL语言描述本体知识,利用斯坦福大学开发的Protégé本体建模工具实现海洋环境灾害链本体建模。在Protégé中,Classes为概念和关系定义模块,主要涉及本体中概念与关系的定义;ObjectProperties为对象属性定义模块,通过该模块定义概念间和实例间的语义关联;DataProperties为数值属性定义模块,通过该模块定义实例数值属性信息;Individuals为本体实例定义模块,需结合关系、属性及约束条件形成实例的完整描述。以下以台风灾害过程为例说明灾害知识规范化描述的具体实现,最终建立由台风灾害所引发的一系列次生/衍生灾害所组成的台风灾害链(图2)。
图2 台风灾害链本体(部分)

Fig. 2 Typhoon disaster chain ontology (partial)

图2是根据海洋环境灾害链本体结构建立的台风灾害链本体。其中,台风会引发大风、暴雨和风暴潮等灾害,进而对近海岸地理对象造成影响,如大风会造成基础设施破坏、农作物倒伏等;暴雨会引发洪涝、滑坡和泥石流,洪涝会造成河水暴涨、农田淹没、城市内涝等,滑坡和泥石流均会造成农田损毁、房屋倒塌、交通阻断等;风暴潮会引发巨浪,继而造成海堤决口、船只沉没、养殖基地受灾等,而海堤决口又引发海水倒灌,继而造成农田淹没、盐田淹没、海岸带侵蚀、基础设施破坏等,最终造成农作物减产、船只搁浅、交通瘫痪、经济收益减少、人员伤亡等影响。同时人类会采取相应的应急处置措施,即,灾害预防,如加固房屋、海堤等;灾害响应,如紧急抢修基础设施等;灾后恢复,如恢复交通等,由此形成互联网台风灾害信息抽取的本体基础。
利用由张华平博士研发的中文语义分析工具——自然语言处理与信息检索系统(Natural Language Processing & Information Retrieval Sharing Platform)对获取的文本内容进行分词处理,识别其中的时空描述词汇,依据词汇间的逻辑顺序利用正则表达式实现词汇提取,并实现时空配准,其中,空间词汇识别主要是识别文本中的地名词汇,时间描述词汇则参考张春菊等[32]提出的划分方式进行识别。台风灾害描述信息的识别则是建立在人类应急处置本体的基础之上,依据本体中灾情词汇描述属性实现互联网相关词汇抽取(图3),并建立词汇与时空位置间的关联,从而实现针对灾害的微博文本信息抽取。
图3 本体中关于灾害预防的词汇描述(部分)

Fig. 3 Lexical description of disaster prevention in the ontology (partial)

以台风灾害文本的数量为评价指标对受灾强度进行分级(≤4为弱等级,5-9为较弱等级,10-15为较强等级,>15为强等级),以发现台风灾害的时空变化特征与舆情关注点(图4图5)。
图4 台风“山竹”影响时空演化过程分析

注:该图基于自然资源部标准地图服务网站下载的审图号为GS(2020)4631号的标准地图制作,底图无修改。

Fig. 4 Analysis of the spatiotemporal evolution of Typhoon Mangosteen's impact

图5 台风“山竹”舆情关注点分析

Fig. 5 Analysis of public opinion focus on Typhoon Mangosteen

台风“山竹”于9月16日17时在广东江门台山市登陆,9月18日晚20时中央气象台对其停止编号,将此期间台风“山竹”的移动路径200 km缓冲区叠加至其影响时空演化图中,可见通过台风本体信息抽取获得的时空变化范围与实际“山竹”移动路径200 km缓冲区较为贴合,随时间逐渐西移并缩小。9月16日,受灾区域集中在广东、广西和海南等,其中影响最大地区为珠江口地区,主要涉及灾害预防和灾害响应及影响,关于防台、防台风等预防内容较多,其影响主要是交通管制、车次停运、学校停课等。9月17日,“山竹”影响范围扩大至贵州、云南等,影响最大地区仍为珠江口地区,主要是灾害影响与响应,停电、停工等灾害影响依然存在,但采取救援、抢修复电等措施以及时应对,此外各地逐渐开始灾后恢复。9月18日,“山竹”影响范围缩小至广东、广西、云南及江西,影响最大地区是珠江口地区,主要涉及灾后恢复,如复电、复产、清障等。
考虑台风发生发展过程中涉及到一系列的次生/衍生灾害,为全面分析台风灾害对周边人群的影响,本文对同一时间段获取的“暴雨”及“风暴潮”文本数据依次进行分词、地名时间识别、灾害词汇识别和标记、时空关联,并以各地区灾害文本数量为依据,对受灾强度高低进行分级(≤3为弱等级,4-8为较弱等级,9-15为较强等级,>15为强等级),结果如图6图9所示。
图6 暴雨影响时空演化过程分析

注:该图基于自然资源部标准地图服务网站下载的审图号为GS(2020)4631号的标准地图制作,底图无修改。因数据获取困难,台湾省数据暂缺。

Fig. 6 Analysis of the spatiotemporal evolution of Rainstorm's impact

图7 暴雨舆情关注点分析

Fig. 7 Analysis of public opinion focus on Rainstorm

图8 风暴潮影响时空演化过程分析

注:该图基于自然资源部标准地图服务网站下载的审图号为GS(2020)4631号的标准地图制作,底图无修改。

Fig. 8 Analysis of the spatiotemporal evolution of Storm surge's impact

图9 风暴潮舆情关注点分析

Fig. 9 Analysis of public opinion focus on Storm surge

图6图7可见,随着时间推移暴雨的影响范围亦是逐渐西移并缩小。9月16日,暴雨的影响范围集中在华南和华东地区,影响最大地区为珠江口、长江口地区,主要涉及灾害预防,如预警、防汛通知等内容,灾害影响也较多,如水浸、交通管制、停电、停课等。9月17日,暴雨影响范围扩大至华中与西南地区,影响最大地区为珠江口、长江口地区,主要涉及灾害预防和灾害响应及影响,其中影响主要有洪水、积水、内涝等,响应措施主要有营救、疏散等。9月18日,暴雨的影响范围有所缩小,影响最大地区为珠江口地区,灾害影响主要有积水、水淹等,响应措施有救援、疏导交通等,此外灾后恢复工作有保险理赔等。
图8图9可见,随着时间推移,风暴潮的影响范围逐渐西移再缩小。9月16日,风暴潮影响的区域为广东与海南等,影响最大地区为珠江口地区,主要涉及灾害预防,如预警、预报等,灾害影响主要有水浸、海水倒灌、海水漫溢等。9月17日,风暴潮影响区域为广东和广西等,影响最大地区为珠江口地区,主要涉及灾害响应及影响,如海水倒灌、水浸、漫堤、积水等。9月18日,风暴潮影响区域缩小至广东,影响最大地区为珠江口,主要涉及灾后恢复,主要为复电、清理、善后等。
将台风、暴雨、风暴潮三者的灾害文本综合起来,以文本数量为评判受灾强度的指标(≤5,列为弱等级,6-12,列为较弱等级,13-31,列为较强等级,>31,列为强等级),并统计每个地区灾害文本的灾害种类的分配情况和主要灾害词语频次,得到台风、暴雨、风暴潮综合影响时空演化过程分析图(图10)及舆情关注点分析图(图11)。
图10 台风、暴雨、风暴潮综合影响时空演化过程分析

注:该图基于自然资源部标准地图服务网站下载的审图号为GS(2020)4631号的标准地图制作,底图无修改。因数据获取困难,台湾省数据暂缺。

Fig. 10 Analysis of the spatiotemporal evolution of Typhoon, Rainstorm and Storm surge's comprehensive impact

图11 台风、暴雨、风暴潮综合舆情关注点分析

Fig. 11 Comprehensive analysis of public opinion focus on Typhoon, Rainstorm and Storm surge

图10可见,3种灾害综合影响时空演化呈西移并逐渐缩小的态势。9月16日,广西和湖南台风灾害影响占优,长江三角洲地区的暴雨灾害影响占优,珠江三角洲地区风暴潮灾害影响占优;9月17日,广东、广西内陆台风灾害影响占优,而其沿海地区风暴潮灾害影响占优,长江三角洲与西南等地区暴雨灾害影响占优;9月18日,广东地区主要受到台风和风暴潮灾害影响,其余地区主要受到暴雨灾害影响。因此,针对台风及其次生灾害影响的综合评估扩展了对台风灾害全过程的认知,丰富了台风影响的语义种类,对灾害影响刻画地更为详实科学,提高了单一台风本体信息抽取的精度。

4.3 精度评价

为了评价互联网文本台风灾害的抽取精度,以形成针对台风灾情的实时感知,从而为灾情评估与灾害救援提供必要的数据支持,本文以暴雨为例,对同一时间段内中国地面降水日值0.5°×0.5°格点数据集(V 2.0)处理为带有行列号、坐标和降水值的CSV格式数据,再进行插值和可视化如图12所示。
图12 2018年9月16日—18日地面观测降水时空演化过程

注:该图基于自然资源部标准地图服务网站下载的审图号为GS(2020)4631号的标准地图制作,底图无修改。

Fig. 12 Spatiotemporal evolution of precipitation from surface observation stations during September 16-18, 2018

可以看出,地面观测降水时空演化范围也具有逐渐西移并缩小的趋势,与图6暴雨影响时空演化过程呈现的范围演化态势较为一致。但是,部分地区有所差别。9月16日,据图12,暴雨侵袭的地区主要为珠江口周围,但据图6,该范围还包括长江口地区;9月17日,二者区别不大,影响区域主要为华南和华东地区;9月18日,据图12所示影响地区集中在西南和江西部分地区,据图6所示其影响范围更涵盖了东南沿海,主要是该地区开始进行灾后恢复工作。
根据微博文本信息抽取分析呈现的暴雨覆盖面积(灾中阶段)及同一时段内地面观测站呈现的暴雨覆盖面积(大于50 mm降雨量),定义暴雨信息抽取精度,表示为式(2):
σ i = S i S i
式中: σ i 取值范围为0~1,表示暴雨信息抽取精度; i取值范围为1~3,分别对应2018年9月16日、 17日、18日; S i 表示第i天由微博文本信息抽取分析呈现的暴雨覆盖面积与地面观测站呈现的暴雨覆盖面积的相交面积; S i 表示第i天由微博文本信息抽取分析呈现的暴雨覆盖面积。据式(2),16日暴雨信息抽取精度为 σ 1 =0.69,17日暴雨信息抽取精度为 σ 2 =0.74;据图6图12,18日暴雨已基本结束,但部分微博文本暴雨表述存在时间上的延后,导致该日期下仍有暴雨事件产生。
综上所述,为形成针对台风灾害全过程的快速分析与评估,可以互联网信息为基础,辅助其他政府部门网站的权威数据,综合处理和分析,从而增强台风灾害评估的语义内涵,为台风灾害防治与应急救援提供必要的科学依据。

5 结论与讨论

海洋环境灾害不仅仅包含单一灾害,也包含单一灾害引发的一系列的次生/衍生灾害,后者表现为灾害在空间和时间维度上的延伸性和拓展性,给人类的行为活动造成持续性影响。仅针对单一灾害的分析将难以全面阐释该灾害的时空演化规律,进而探究其影响范围和影响程度。为形成面向海洋灾害发展过程的全面认知,本文从灾害链的角度分析灾害发生发展过程中所涉及的诸多要素,构建了海洋环境灾害链本体框架,形成海洋环境灾害概念、关系、属性等知识的形式化描述。并以台风灾害为例,通过台风灾害链知识建模,实现了互联网灾害信息抽取与时空变化过程分析。结果表明:以海洋环境灾害链本体为基础的信息抽取过程可以获得隐藏在互联网文本中的灾害描述信息,能够用于分析灾害的发展变化过程及其对人群行为活动的影响,突破了当前单一灾害过程分析的局限性,为灾害防治与应急救援提供一定科学支持。
互联网中所蕴含的海洋环境灾害描述为灾害发生发展过程及其作用下人群行为活动描述提供了重要数据支撑,互联网信息抽取就是从大量的文本信息中抽取感兴趣的事实信息,并形成结构化表达以供进一步分析。基于海洋环境灾害链本体的互联网信息抽取,改变了以单一灾害分析代表整个灾害过程分析的局限性,从而形成对灾害过程相关信息的全面发现与分析。互联网海洋环境灾害信息抽取的精度一方面与本体中灾害知识形式化描述的全面性有关,另一方面与次生灾害文本获取的全面性有关:对于前者,本文在现有国家灾害分类标准的基础上,考虑各灾种间的诱发/伴随关系,形成针对整个海洋环境灾害过程较为完整的描述,以阐明一系列连续性灾害所引发的诸多影响,然而互联网信息表述的多样性给灾害信息抽取带来一定困难,需继续收集整理互联网中提及的灾害知识以充实本体框架;而对于后者,需针对灾害的次生/衍生灾害,补充文本数据以充实原始语料,从而增加灾害信息抽取的详实性。
[1]
Goodchild M F, Glennon J A. Crowdsourcing geographic information for disaster response: a research frontier[J]. International Journal of Digital Earth, 2010,3:231-241.

[2]
Studer R, Benjamins V R, Fensel D. Knowledge engineering: Principles and methods[J]. Data & Knowledge Engineering, 1998,25(1-2):161-197.

[3]
洪烨, 康明娟, 李仁杰, 等. 旅游地理本体模型设计与张家界实例研究[J]. 地理与地理信息科学, 2016,32(3):95-99.

[ Hong Y, Kang M J, Li R J, et al. Ontology model design of tourism geography and Zhangjiajie case study[J]. Geography and Geographic Information Science, 2016,32(3):95-99. ]

[4]
杜云艳, 张丹丹, 苏奋振, 等. 基于地理本体的海湾空间数据组织方法——以辽东湾为例[J]. 地球信息科学学报, 2008,10(1):7-13.

[ Du Y Y, Zhang D D, Su F Z, et al. Organization method of bay spatial data based on geographic ontology: Taking Liaodong Bay as an example[J]. Journal of Geo-information Science, 2008,10(1):7-13. ]

[5]
Buccella A, Cechich A, Gendarmi D, et al. Building a global normalized ontology for integrating geographic data sources[J]. Computers and Geosciences, 2011,37(7):893-916.

[6]
Bittner T, Donnelly M, Smith B. A spatio-temporal ontology for geographic information integration[J]. International Journal of Geographical Information Science, 2009,23(6):765-798.

[7]
Janowicz K, Raubal M, Kuhn W. The semantics of similarity in geographic information retrieval[J]. Journal of Spatial Information Science, 2011,2(2):29-57.

[8]
张宇, 苏奋振, 王琦, 等. 岛礁本体构建及其在空间数据组织中的应用[J]. 地理与地理信息科学, 2017,33(3):52-58.

[ Zhang Y, Su F Z, Wang Q, Wu W Z. Island reef ontology construction and its application in spatial data organization[J]. Geography and Geographic Information Science, 2017,33(3):52-58. ]

[9]
孙凯, 诸云强, 潘鹏, 等. 形态本体及其在地理空间数据发现中的应用研究[J]. 地球信息科学学报, 2016,18(8):1011-1021.

DOI

[ Sun K, Zhu Y Q, Pan P, et al. Research on morphological ontology and its application in geospatial data discovery[J]. Journal of Geo-information Science, 2016,18(8):1011-1021. ]

[10]
常丽丽. 基于海洋生态本体的知识管理系统的研究与实现[D]. 青岛:中国海洋大学, 2011.

[ Chang L L. Research and implementation of knowledge management system based on marine ecological ontology[D]. Qingdao: Ocean University of China, 2011. ]

[11]
Xu J, Nyerges T L, Nie G. Modeling and representation for earthquake emergency response knowledge: Perspective for working with geo-ontology[J]. International Journal of Geographical Information Science, 2014,28:185-205.

DOI

[12]
朱国琴, 石少华, 许啸春, 等. 海洋灾害领域本体研究及应用[J]. 海洋信息, 2009(2):7-10.

[ Zhu G Q, Shi S H, Xu X C, et al. Ontology research and application in the field of marine disasters[J]. Marine Information, 2009(2):7-10. ]

[13]
Yang Z, Lin G, Chen J. The domain ontology of typhoon disasters and its application[C]. International Conference on Geoinformatics, Shanghai, China. IEEE, 2011: 1-5.

[14]
Hong J H, Kuo C L. A semi-automatic lightweight ontology bridging for the semantic integration of cross-domain geospatial information[J]. International Journal of Geographical Information Science, 2015,29(12):1-25.

DOI

[15]
Lopez-Pellicer F J, Silva M J, Chaves M, et al. Geo linked data[J]. Lecture Notes in Computer Science, 2010,6261:495-502.

[16]
Raskin R G, Pan M J. Knowledge representation in the semantic web for Earth and environmental terminology(SWEET)[J]. Computers & Geosciences, 2005,31(9):1119-1125.

[17]
Auer S, Bizer C, Kobilarov G, et al. DBpedia: Anucleus for a web of open data[J]. Semantic Web, 2007,4825:722-735.

[18]
栗斌. 面向地理事件的地理本体构建研究[D]. 武汉:武汉大学, 2014.

[ Li B. Research on geographic ontology construction for geographic event[D]. Wuhan: Wuhan University, 2014. ]

[19]
马雷雷, 李宏伟, 连世伟, 等. 一种自然灾害事件领域本体建模方法[J]. 地理与地理信息科学, 2016,32(4):12-17.

[ Ma L L, Li H W, Lian S W, et al. An ontology modeling method for the field of natural disaster events[J]. Geography and Geographic Information Science, 2016,32(4):12-17. ]

[20]
刘纪平, 栗斌, 石丽红, 等. 一种本体驱动的地理空间事件相关信息自动检索方法[J]. 测绘学报, 2011,40(4):502-508.

[ Liu J P, Li B, Shi L H, et al. An ontology-driven automatic retrieval method for geospatial event-related information[J]. Journal of Surveying and Mapping, 2011,40(4):502-508. ]

[21]
王敬贵. 基于地理本体的空间数据集成研究[D]. 北京:中国科学院大学, 2005.

[ Wang J G. Research on spatial data integration based on geographic ontology[D]. Beijing: University of Chinese Academy of Sciences, 2005. ]

[22]
黄茂军, 杜清运, 吴运超, 等. 地理本体及其应用初探[J]. 地理与地理信息科学, 2004,20(4):1-5.

[ Huang M J, Du Q Y, Wu Y C, et al. Geographic ontology and its application[J]. Geography and Geographic Information Science, 2004,20(4):1-5. ]

[23]
易茹兰, 陈建军, 邓敏, 等. 黄土地貌本体的构建方法研究[J]. 地理与地理信息科学, 2009,25(2):46-49.

[ Yi R L, Chen J J, Deng M, et al. Research on the construction method of loess landform ontology[J]. Geography and Geographic Information Science, 2009,25(2):46-49. ]

[24]
王东旭, 诸云强, 潘鹏, 等. 地理数据空间本体构建及其在数据检索中的应用[J]. 地球信息科学学报, 2016,18(4):443-452.

[ Wang D X, Zhu Y Q, Pan P, et al. Spatial ontology construction of geographic data and its application in data retrieval[J]. Journal of Geo-information Science, 2016,18(4):443-452. ]

[25]
Uschold M, King M. Towards a methodology for building ontologies[A]. IJCAI-95 Workshop on Basic Ontological Issues in Knowledge Sharing[C]. Montreal, Canada: 1995.

[26]
Grüninger M, Fox M S. Methodology for the design and evaluation of ontologies[A]. In Proceedings of the Workshop on Basic Ontological Issues in Knowledge Sharing held in conjunction with IJCAI-95[C]. Montreal, Canada: 1995.

[27]
Fernández-López M, Gómez-Pérez A, Juristo N. Methontology: From ontological art towards ontological engineering[A]. AAAI-97 Spring Symposium on Ontological Art Towards Ontological Engineering[C]. Stanford University: 1997.

[28]
Noy N F, McGuinness D L. Ontology development 101: A guide to creating your first ontology[R]. Stanford: Stanford University, 2001: 3-23.

[29]
张宝军, 马玉玲, 李仪. 我国自然灾害分类的标准化[J]. 自然灾害学报, 2013,22(5):8-12.

[ Zhang B J, Ma Y L, Li Y. Standardization of natural disaster classification in China[J]. Journal of Natural Disasters, 2013,22(5):8-12. ]

[30]
全国公共安全基础标准化技术委员会. 突发事件分类与编码[S]. 北京: 中国标准出版社, 2018.

[ National Public Safety Basic Standardization Technical Committee. Emergency classification and coding[S]. Beijing: China Standard Press, 2018. ]

[31]
国家测绘局. 基础地理信息要素分类与代码[S]. 北京: 中国标准出版社, 2006.

[ National Bureau of Surveying and Mapping. Classification and codes of basic geographic information elements[S]. Beijing: China Standard Press, 2006. ]

[32]
张春菊, 张雪英, 李明, 等. 中文文本中时间信息解析方法[J]. 地理与地理信息科学, 2014,6(30):1-6.

[ Zhang C J, Zhang X Y, Li M, et al. Analytic method of time information in Chinese text[J]. Geography and Geographic Information Science, 2014,6(30):1-6. ]

Outlines

/