地理信息技术在海事领域的应用

基于厦门港的海上交通事故地理空间分布及风险预测研究

  • 杨洋 , 1 ,
  • 邵哲平 1, 2 ,
  • 赵强 1, 2 ,
  • 潘家财 1, 2 ,
  • 胡雨 4 ,
  • 梅强 , 1, 2, 3, *
展开
  • 1.集美大学航海学院,厦门 361021
  • 2.船舶辅助导航技术国家地方联合工程研究中心,厦门 361021
  • 3.上海海事大学商船学院,上海 201306
  • 4.中科(厦门)数据智能研究院,厦门 361021
* 梅 强(1987— ),男,安徽宿州人,助教,主要从事海事地理信息分析研究等。E-mail:

杨 洋(1994— ),女,四川眉山人,硕士生,主要从事海事地理信息研究。E-mail:

收稿日期: 2021-08-04

  修回日期: 2021-12-14

  网络出版日期: 2022-11-25

基金资助

国家自然科学基金项目(71804059)

福建省自然科学基金项目(2021J01821)

福建省教育厅面上项目(JAT200265)

船舶辅助导航技术国家地方联合工程研究中心开放基金(JMCBZD202002)

Geographical Spatial Distribution and Risk Prediction of Maritime Traffic Accidents in Port of Xiamen

  • YANG Yang , 1 ,
  • SHAO Zheping 1, 2 ,
  • ZHAO Qiang 1, 2 ,
  • PAN Jiacai 1, 2 ,
  • HU Yu 4 ,
  • MEI Qiang , 1, 2, 3, *
Expand
  • 1. Navigation College, Jimei University, Xiamen 361021, China
  • 2. National-Local Joint Engineering Research Center for Aids to Navigation, Xiamen 361021, China
  • 3. Merchant Marine College, Shanghai Maritime University, Shanghai 201306, China
  • 4. Xiamen Data Intelligence Academy of Chinese Academy Sciences, ICT, Xiamen 361021, China
* MEI Qiang, E-mail:

Received date: 2021-08-04

  Revised date: 2021-12-14

  Online published: 2022-11-25

Supported by

National Natural Science Foundation of China(71804059)

Natural Science Foundation of Fujian Province(2021J01821)

Science and Technology Project of Education Department of Fujian Province(JAT200265)

Open Foundation of National-Local Joint Engineering Research Center for Aids to Navigation(JMCBZD202002)

摘要

利用海上交通事故空间分布特征进行安全分析是海上交通安全管理的重要组成部分。本文使用厦门港2008—2020年的海上交通事故数据,经过事故数据空间分布特征提取、分析及预测等流程,最终得到厦门水域海上交通事故潜在危险区域。本文首先使用原始事故数据在GIS软件中进行空间定位,形成事故点的可视化空间分布图,然后使用核密度分析法鉴别海上交通事故多发区域,再利用空间自相关分析法,得到该区域事故空间的分布特征和具体的聚集点,最后使用该分布特征、对目标水域数据进行标准化网格切分,并利用机器学习算法对潜在事故风险区域进行预测。本文在核密度分析结果中发现:就事故频度而言,厦门湾和西海域交通事故频度较高。在空间自相关分析的结果中表明:就空间分布特征而言,厦门港的空间分布出现聚集特征且为空间正相关模式,且就事故具体的空间聚集点而言,厦门湾和西海域仍是事故高发的中心区域。而最后的厦门湾及周边水域风险预测模型显示:潜在事故风险区域多位于沿海和河口交汇区域。本文研究结果表明在基于地理空间数据分布特征提取和网格化分析的基础上,结合机器学习方法(随机森林),对于海上交通事故的预测具有良好的效果。

本文引用格式

杨洋 , 邵哲平 , 赵强 , 潘家财 , 胡雨 , 梅强 . 基于厦门港的海上交通事故地理空间分布及风险预测研究[J]. 地球信息科学学报, 2022 , 24(9) : 1676 -1687 . DOI: 10.12082/dqxxkx.2022.210455

Abstract

Safety analysis based on the spatial distribution of maritime traffic accidents is of great significance for maritime traffic safety management. In this paper, we obtained the potential risk areas of maritime traffic accidents in Xiamen waters through extraction, analysis, and prediction of spatial distribution of maritime traffic accident data in Xiamen Port from 2008 to 2020. The original accident data were firstly used for spatial orientation in GIS software to form a visualized spatial distribution map of accident points. Then, the areas where maritime traffic accidents frequently occur were identified using the kernel density analysis. In addition, the spatial autocorrelation analysis method was employed to obtain the spatial distribution characteristics and specific gathering points of accidents in this region. Finally, we performed standardized grid segmentation on the data in the target waters based on the spatial distribution characteristics and predicted potential risk areas of maritime traffic accidents using a machine learning algorithm (i.e., random forest). The kernel density analysis results showed that Xiamen Bay and Western Sea were high risk areas in terms of accident frequency. Moreover, the spatial autocorrelation analysis results indicated that in terms of spatial distribution characteristics, the spatial distribution of Xiamen Port showed aggregation characteristics and was positively correlated with time. For specific spatial gathering points of accidents, Xiamen Bay and Western Sea were still the centers with a high incidence of accidents. Furthermore, the risk prediction model of Xiamen Bay and its surrounding waters demonstrated that potential risk areas of maritime traffic accidents were mostly located at the intersection of coastal and estuary areas, because there were frequent crossings of vessels and fishing boats. The results of this study show that based on the distribution characteristics extracted and grid analysis of geospatial data, our proposed method has a good effect in predicting maritime traffic accidents by use of machine learning methods.

1 引言

通航水域的空间属性是影响海上交通事故发生的重要因素之一。航运界对于海上交通事故的研究通常从船舶种类、船舶大小、发生时间、人的因素等方面入手,少有学者关注到海上交通事故的空间分布问题。针对海上交通事故缺乏空间分布特征研究的问题,本文借鉴道路交通事故的研究方法(密度分析和空间自相关分析),对海上交通事故发生的频度和事故聚集特征进行分析,从而得到海上交通事故的空间分布特性。再将空间分布特征与随机森林风险预测模型相结合,预测区域内各处事故发生概率。该研究结论可以帮助交通管理部门对辖区内的交通安全状况有更为形象直观的认识和理解,并可据此有针对性地采取措施进行改善,从而提高航运安全。
业界常常通过对水域航行数据进行海上交通风险评估和预测,以提高航运的安全性。例如王焕新等[1]运用N-K模型构建海上交通安全风险耦合度量模型,计算不同风险耦合的发生概率和风险值。沈贤达等[2]提出基于综合风险矩阵法和模糊层次综合评价的海上风机基础安全性评价方法,以此评价海上风机基础安全性。郑义彬等[3]运用系统动力学(Systems Dynamics)方法建立江汉运河通航风险管理模型,借助Vensim软件模拟江汉运河通航风险管理系统中各个因素间的相互作用关系。张骞予等[4]构建通航环境综合风险评估模型(ARERAC模型)进行水上交通安全风险源评估。鲁峰等[5]针对航道通航环境安全评价过程中的模糊性和随机性问题,构建基于可拓云理论的航道通航环境安全评价模型。虞盈等[6]运用灰色马尔科夫预测模型对福建辖区内的船舶交通事故进行预测。汪强[7]运用弱化算子改进传统灰色GM(1, 1)模型对福建辖区未来三年海域海上交通事故进行预测。徐东星等[8]提出一种基于优化背景值和残差综合修正的三参数灰色预测模型,应用于我国海上船舶交通事故的模拟与预测。王清斌等[9]则从预测事故类型出发,采用改进XGBoost算法,揭示风险因素与船舶风险之间的交互关系。
另外,针对船舶航行领域风险等级的研究,也一直是航运安全关注的热点之一。例如,Zhuang等[10]选取南通吕四港区开展LNG船舶的航行风险研究,通过层次分析法和模糊综合评价法计算LNG船舶的航行风险等级; Ung[11]采用改进的贝叶斯网络(BN)方法进行航行风险估计,将海洋事故数据中的各参数作父子节点处理,将航行风险结果的敏感性分析与MOTC数据的事故频率及事故严重程度进行比较,验证了BN模型的合理性; Zhao等[12]将自动识别系统(AIS)的维度数据与速度障碍途径相结合,提出了一种投影碰撞裕度(MPC)指标,该指标可以作为传统碰撞风险指数的很好补充; Dinis等[13]提出了一种基于贝叶斯网络(BNs)的船舶静态风险概率描述方法建立BNs模型,该分析显示模型与船舶风险概况标准以及从历史PSC检查数据中开发的其他研究结果保持一致; Ruan等[14]研究如何构建高精度、快速的船舶风险预测模型,并提出一种基于大数据和人工智能的船舶风险预测模型设计方案。
从风险评估、风险预测、风险等级等角度来看,目前对于海上交通事故的原有研究方法基本采用评价类模型,但此类方法多依赖于主观专家评判,缺乏基于空间分布特征的事故分析方法研究。而在其他领域,将地理信息系统(Geographic Information System,GIS)中的空间分析与密度分析应用于交通事故分析已有先例。例如, Jiang等[15]分析摩托车事故:①利用关联规则挖掘(Association Rule Mining,ARM)方法,用于识别与损伤严重程度相关的关键因素; ②利用GIS进行空间分析,呈现摩托车事故热点; Li等[16]利用空间分析方法研究航空事故的空间分布特征,识别航空事故热点,提高航空事故应急管理的准确性。Sameen等[17]基于几何回归和地理信息系统,采用激光扫描数据和事故历史提取的高速公路几何特征(即横向线形和纵向线形)研究事故发生与道路几何设计特征之间的关系; Shafabakhsh等[18]应用地理信息技术与空间统计分析相结合的方法,将聚类技术应用于城市道路,并利用ARCMAP进行核密度估计(Kernel Density Estimation,KDE),揭示了伊朗城市交通事故形成过程中空间因素的影响; Aghajani等[19]通过利用地理信息系统(GIS)建立事故易发地点的时空模式相关性,对事故热点进行识别和建模,研究局部化模式和热点分布的使用,有助于决策者采取适当措施减少道路交通事故; Cepni等[20]认为地理信息系统(GIS)使从空间角度生成空间分布图、模型和风险估计成为可能。研究表明,时空可视化技术可以对交通事故的分析采用定量统计技术,对了解事故的演变具有重要意义。
通过文献调研,海上交通事故分析采用GIS地理空间方法具有可行性。 ① 对比其他领域交通事故发生地的复杂空间属性,船舶航行的通航水域空间属性相对简单,通航路线也较为固定,能排除更多不确定影响因素,研究结果可以更为准确; ② 海上交通事故本身具有可用于分析的事故要素,可以利用GIS中的空间分析工具,去多维度挖掘交通事故存在的空间分布特性。故本文探索一种基于地理信息系统的海上交通事故分析方法,主要工作如下: ① 通过事故原始资料明确事故群空间定位和事故发生地坐标,总结事故类型和数量。 ② 通过地理信息系统技术中的核密度方法与空间自相关性方法得到海上交通事故的分布特征,得到事故发生与地理空间位置的相关性。 ③ 利用随机森林模型对可能发生事故的网格进行分类预测。

2 研究方法与相关技术

本文的研究过程分为4步: ① 提取海上交通事故数据中的经纬度、等级等要素,确定事故的地理空间位置和不同等级事故的分布状况。 ② 利用核密度分析方法得到海上交通事故密度分布情况,鉴别事故多发的区域; ③ 利用空间自相关分析方法对该密度分布情况下的事故聚类性质(即集群性)进行分析,进一步得到事故局部分布特征和事故分布具体的聚集点。 ④ 对海上区域进行标准化的统计网格切分,以网格内不同维度的交通流统计特征作为输入要素,结合随机森林模型对切分的网格区域进行预测。具体流程图见图1
图1 厦门港事故空间分析研究流程

Fig. 1 Flow chart of GIS spatial feature analysis study of maritime traffic accidents

2.1 核密度分析方法

核密度分析可以判断事故点与其周围的聚焦态势,从而反映出该领域事故的分布态势。事故核密度的测算是依据研究区事故点的空间分布要素来计算事故的集聚特征。若核密度估算值越大,则事故空间分布密度越高、危害越大。核密度定义为:设x1,x2,x3,⋯xn是围内(带宽 h)各栅格单元中心点的密度值,若搜寻半径范围内的栅格单元中心点距离样本越近,则密度值越大。本文使用Rosenblatt-Parzen核估计模型,计算方法为[21]
f n = 1 n h i = 1 n k x - x i h
式中: f n为事故点分布的核密度值; n为事故点数量; k为核密度函数; x - x i为测算事故点 x到样本点 x i的距离; h为核密度测算带宽。

2.2 空间自相关分析方法

2.2.1 Moran's I分析方法

空间自相关系数常用来定量地描述事故点在空间上的依赖关系。本文采用Moran's I方法来研究事故点之间的空间自相关性,它可以反映事故点之间的空间聚集关系。计算公式[22]如下:
I = n s 0 i = 1 n j = 1 n w i , j z i z j i = 1 n z i 2
式中: w i , j是要素 i j间的空间权重; z i z j分别为事故点在空间单元 i , j标准化后的观测值; n等于事故点总数; S 0是所有空间权重的聚合。
S 0 = i = 1 n j = 1 n w i , j
统计的 Z I得分按以下形式计算:
Z I = I - E I V I
其中:
E I = - 1 n - 1
V I = E I 2 - E I 2
式中: V I为Moran's I的方差; E I为Moran's I的期望值。
在全局莫兰指数计算完成后,若I值为正,表示空间呈正相关性,其值越大,空间相关性越明显;若I值为负,表示空间呈负相关性,其值越小,空间差异越大;若I值为零,则表明空间分布呈随机性。

2.2.2 Local Moran's I自相关分析和热点分析方法

在全局莫兰相关分析中,如果Moran's I显著,即可认为在该区域上事故点存在空间相关性。然而大多时候,空间聚集现象中的事故具体点并不明确,需要Local Moran's I(局部莫兰指数)参与帮助说明。在本文中热点分析作为Local Moran's I的补充工具,用于分析事故发生的热点区域,从而对事故集的空间分布进行补充验证,本文在此处不做详细介绍。空间关联的Local Moran's I计算公式如下所示[22]
I i = x i - X - S i 2 j = 1 , j i n w i , j x j - X -
式中: x i是要素 i的事故等级属性; X -是对应属性的平均值; w i , j是要素 i j之间的空间权重; S i是所有空间权重的聚合。
S i 2 = j = 1 , j i n x j - X - n - 1 2
式中: n等于事故点。
总统计数据的 z I i得分的计算方式如下:
Z I i = I i - E I i V I i
其中:
E I i = - j = 1 , j i n w i , j n - 1
V I i = E I i 2 - E I i 2
式中: E I i为期望值; V I i为方差值。
在局部莫兰指数中,一般采用统计显著性置信度95%,即P值小于0.05时可认为是统计显著的。在统计显著的条件下,若I值为正,表示数据点与临近点有同样高或同样低的属性值,该点为高-高值聚类或低-低值聚类的一部分。该点属性值与全部数据点的属性平均值的大小关系决定了是高-高值聚类还是低-低值聚类。若I值为负,表示数据点与临近点的属性值有较大差异,即该点是异常值。

2.3 基于标准网格特征建立随机森林事故预测模型

发生海上事故的风险与船舶的速度、大小、区域流量等交通特征关系密切[23]。由于海上事故点较少且具有明显的离散分布特征,因此本文采用标准化网格统计方法建立统一的网格尺度,将事故数量与网格小区域的交通特征在网格内建立映射关系[24-25],如图2所示。
图2 预测模型中训练集映射关系构建

Fig. 2 Construction of training set mapping relationship in prediction model

具体计算步骤如下:
(1)建立标准化的网格,对海上研究区域进行细粒度的网格划分;
(2)由于船舶事故与海区内船舶的尺寸、船速、对遇情况以及区域内船舶流量都有密切关系,因此网格统计维度应包括通过网格的船舶流量,船舶的平均长度、宽度,航向和速度的标准差以及平均速度。
(3)利用随机森林算法建立二分类的预测任务,完成预测模型构建。使用训练集数据完成模型的训练后,再在测试集上完成对事故的预测。

3 以厦门港为例的事故空间分析

3.1 研究区域选择及数据来源

本文选取厦门港作为研究对象。厦门港经度118°04 ′E,纬度24°27 ′N,位于我国东南沿海,是我国沿海主要港口之一,是国家一类开放口岸,同时也是中国东南国际航运中心。港口主要情况分布图如图3所示。
图3 厦门港基本情况

Fig. 3 Xiamen port basic information chart

本文采用厦门海事局2008年1月—2020年1月的港口交通事故数据[26](财产损失、受伤、死亡类事故等),共计127条(在GIS可视化中,选取100条数据进行分析)每条记录包括事故发生的经纬度、时间、事故类型、事故等级等信息。

3.2 研究数据统计分析

根据我国《水上交通事故统计办法》[27],水上交通事故按照按类分为:碰撞事故、搁浅事故、触礁事故、触碰事故、浪损事故、火灾和爆炸事故、风灾事故、自沉事故、操作性污染事故、其他水上交通事故;而水上交通事故等级分为:特别重大事故、重大事故、较大事故、一般事故、小事故。如表1所示。
表1 事故严重等级分级及标准

Tab. 1 Injury severity level of traffic crashes

事故等级 人员伤亡 直接经济损失 水域环境污染
特别重大事故 30人以上死亡(含失踪),或者100人以上重伤 1亿元以上 溢油1000 t以上致污
重大事故 10~30人以下死亡(含失踪),或50~100人以下重伤 5000万元~1亿元以下 溢油500~1000 t致污
较大事故 3~10人以下死亡(含失踪),或10~50人以下重伤 1000万元~5000万元以下 溢油100~500 t致污
一般事故 1~3人以下死亡(含失踪),或1~10人以下重伤 100万元~1000万元以下 溢油1~100 t致污
小事故 指未达到一般事故等级
应用原始事故数据在GIS软件中进行空间定位,形成事故点的可视化空间布局。厦门港事故类型分布如图4所示。
图4 事故类型分布

Fig. 4 Accident type distribution map

图4所示,海上交通事故位于23°00—24°30 N,117°34—119°54 E,事故类型大多是碰撞事故。浪损事故发生在厦门湾西海域段;火灾和爆炸事故,发生在厦门湾湾口和同安湾湾口;碰撞事故,几乎遍布全港内外,主要分布于厦门港东海域、厦门湾、西海域;自沉事故,同样港内港外均有;触碰事故,基本在港内发生(触碰是指船舶触碰到岸壁、码头、航标、桥墩、钻井平台等固定物或沉船、沉物,木桩、鱼栅等障碍物);触礁事故,发生在厦门湾东海域,该处水域多沙滩、泥滩、多礁石;操作性污染是指船舶在港口排放、泄露、溢出油类污水及油性混合物或者散装有毒有腐蚀性物质洗舱水、压载水等,大多发生在厦门湾;搁浅事故,则分布在东海域、厦门湾附近。
而导致各类事故发生的原因各不相同。如浪损事故发生在大多发生在西海域段,该海域为南北走向,受厦门岛、鼓浪屿等诸多岛屿屏障作用,外海东南方向的大浪难以进入该海域,此处发生浪损最大的原因可能是船舶本身行驶时所兴起的波浪,而致使临近的其他船舶或者本船的物体、设施等遭受损失。火灾爆炸事故分布在湾口,发生该事故其一原因是该处船舶流量大,交通形式复杂,交通环境复杂,从而导致船-船或者船-物相撞;其二是船舶本身存在火灾安全隐患。碰撞事故大多分布在湾内和湾口,这些区域均是交通流量大、交通密度大的区域,若能见度不良或者其他情况导致驾驶员疏忽瞭望,很容易发生碰撞事故。自沉事故发生地港内外均有,原因通常是船体破损进水导致。触礁事故发生在航行环境较为复杂的东海域,多为驾驶员疏忽所致。操作性污染大多由人为疏忽或者故意排放造成,分布在入港处和港口附近较多。搁浅事故一般发生在港内礁石密布的的区域。
图5的事故类别分布表可知,海上交通事故占比最高的是船舶碰撞事故(2艘以上船舶之间发生撞击造成损害的),其次是火灾/爆炸事故、触碰事故,相对来说操作性污染、浪损发生较少。海上交通事故按照人员伤亡、直接经济损失或者水域环境污染情况等要素分级,小事故指未达到一般事故等级的事故。由图4事故等级分布图可知,厦门港小事故在总体中占比最高,其次是一般事故,重大事故发生的占比很低,较大事故在整体事故发生数量中居中等水平。
图5 2008—2020年厦门港事故类别图和事故等级分类

Fig. 5 Xiamen port accident category chart and accident level classification chart from 2008 to 2020

3.3 基于核密度分析的厦门港海上交通事故空间分布特征

衡量航道交通安全的一个指标是单位航道内发生交通事故的数量。核密度分析方法可以分析厦门港交通事故的空间分布疏密状态,得到事故发生频度较高的航区段。本文基于2008年1月—2020年1月的厦门港海上交通事故数据,根据式(1)的计算方法可得事故点空间分布密度,将整个分析区域内的要素核密度值叠加,得到区域内所有栅格的核密度值[28-29]
核密度空间分布计算结果如图6所示,不同的色块代表不同的密度,色度由浅到深,色度越深证明聚集度越高事故密度越大。该事故集在空间上集聚分布有所差异,形成不同集聚中心(风险值最高),其主要集聚中心为厦门湾和西海域。厦门湾主航道内主要分布了3个港区(后石港区、招银港区、海沧港区)以及4个码头(海天码头、邮轮码头、海通码头、嵩屿码头)。而次要聚集中心分布在东海域附近,翔安港区、大金门岛附近、北东水道、虎屿岛附近。在同安湾、九龙江河口中,这些区域的颜色并不深,说明这些区域事故发生率不高。针对主要集聚中心聚集度高的情况,结合厦门港目前航线情况分析(集装箱航线达142条,其中远洋航线34条、近洋航线40条、港台航线10条内支线15条、内贸线43条)可知港内日交通流量巨大(图7),由此事故发生可能性大大提高[30]
图6 2008—2020年厦门港海上交通事故核密度空间分布

Fig. 6 Spatial distribution of nuclear density of maritime traffic accidents in Xiamen port from 2008 to 2020

图7 厦门港港内日交通AIS轨迹

Fig. 7 AIS flow chart of daily traffic in the port of Xiamen

结合图6图7,针对聚集度高的厦门湾和西海域区域,可以看出该区域交通流较为密集且船舶航迹纵横交错(即多艘进出港船舶同时通过同一水域)。东渡航道、海沧航道与厦门湾主航道3个航道的交汇处,同时也是港内小型船舶航线习惯性的交汇处(进出九龙江的小型货船均在此汇集,还有厦门来往漳州开发区和龙海的客渡船,鼓浪屿与嵩屿客渡船,环鼓浪屿游览快艇),各类船舶密集相遇,增加了航行难度。此处容易产生事故的原因有:
(1)地理环境因素和水文气象因素。涨落潮在此水域分散或汇集,流速大,流向变化大,更是有涡流产生,对于大型船舶和拖带船组的操纵影响极大。
(2)船舶、船员、船公司管理、主管机关管理原因。船舶进出港准备工作不充分,船舶负责人没有充分评估水域的交通态势复杂性;驾驶员未能对复杂通航环境和船舶交会局面做出充分的估计和正确的判断;进出港过程中,设备的不安全状态,船员的不安全行为,驾驶台资源管理缺失等。
(3)港口设施因素。港口船舶大型化明显,而通航环境改变不大;航道狭窄,例如海沧航道和东渡航道之间码头挡住视线,驾驶员不易用视觉观察到对方航道上的出港船,从而发生事故。
上述分析主要是进行了事故发生频度的比较,得到了厦门港事故频发的区域,分析了该区域事故频发的原因。然而,事故频度只是衡量交通事故严重性的一个指标,另一个指标是事故本身的严重程度。本文接下来将根据实际数据的情况,结合表1的事故严重等级分级标准,进行空间自相关分析,得到事故等级与事故空间分布特征之间的关系、事故的空间聚类特性。

3.4 基于Moran's I的空间自相关性分析的厦门港海上交通事故空间分布特征

图8为厦门港Moran's I分析的报表图片。选定数据后,在GIS工具栏中选择空间自相关工具,选择特征字段为事故严重程度,选择距离阈值为400。数值输入后,空间自相关工具返回5个值,分别是:Moran's I指数、预期指数、方差、z得分及p值。莫兰指数中由P值和Z得分来判定空间相关性。方差反应事故点间的离散程度。P值为概率值,Z得分表示标准差的倍数。把p值和z值与莫兰指数相关联,可得到空间自相关性的置信度。置信区间是指由事故样本统计量所构造的总体事故参数的估计区间,置信区间越大,即异常值的概率越大,该结论可得出厦门港的事故集出现集聚或异常值的概率大小(如果全局有自相关出现,可做局部自相关,Local Moran's I能定位异常值或者集聚点)。
图8 莫兰指数报表图片

Fig. 8 Moran index statement picture

结合图8表2看,假如P值<0.01,且Z得分>2.58,那么就落在图的最右边的区域,即99%的把握要素是集聚分布的。对应的,如果P值<0.01,且Z得分<-2.58,那么就落在图的最左边的区域,即有99%的把握要素是离散分布的。假如P值<0.01,但Z得分<2.58,那么就表示不能拒绝零假设,则实验是失败的。
表2 z值、p值与置信度

Tab. 2 z-value, p-value and confidence level

Z得分(标准差) P值(概率) 置信度/%
<-1.65或>+1.65 <0.10 90
<-1.95或>+1.95 <0.05 95
<-2.58或>+2.58 <0.01 99
图8可知,该Moran's I报表图片呈现为显著性正态分布,分为三部分,中间部分为随机分布,右侧为集聚分布,左侧为离散分布。表3中,其莫兰指数指数约为0.124,Z得分约为1.81,约为标准差的1.81倍,结合莫兰指数值为正,可以得出结果分布在正态分布的右侧,为聚集性。P值约为0.103,表明该结果百分百不为随机数据生成,结果具有可信度。由图8中“随机产生此聚类模式的可能性小于10%”,表明该数据有90%的把握数据是聚类的,出现数据聚集的可能性大于随机分布的可能性。故得出结论,厦门港海上交通事故的空间分布,出现一定的聚集特征,且为空间正相关模式。
表3 全局莫兰汇总

Tab. 3 Moran's I summary

Moran's I指数 预期指数 方差 Z得分 P
0.1245 -0.0101 0.0055 1.8108 0.0705

3.5 基于 Local Moran's I自相关分析和热点分析的厦门港海上交通事故空间分布特征

由上述结论可得知该事故集相关联且为聚类分布,但具体的空间聚集点是未知点。为了得出具体的空间聚集点,在Moran's I分析的基础上,进行 Local Moran's I分析自相关分析和热点分析[31]图9图10显示了通过Local Moran's I自相关分析和热点分析后得到的厦门港交通事故分布的聚类结果,选择的特征字段是事故严重程度。
图9 局部莫兰分析

Fig. 9 Anselin local Moran's I

图10 冷热点分析

Fig. 10 Getis-Ord Gi* analysis

图9中,黑色点表明事故等级无明显差异(Not Significant);红色点代表高离群值点(High Outlier),即事故严重等级高的被事故严重等级低的包围;由于本组数据重大事故的比例占比只有2%,故不存在高等级包围低等级事故的情况。事故严重等级较高的分布在厦门港西海海域和厦门湾。其中,西海海域岛屿礁石分布较多,而厦门湾为涨、落潮流交汇区,水动力较为复杂,一直处于弱淤积状态,船舶在此处航行难度高出其他航段。小事故遍布港内港外,发生原因其一是由于沿海小型船舶、渔船船员技术素质差且缺乏良好的教育与培训,导致小吨位船小事故频发;其二是事故船舶违反通航规定,关闭船舶自动识别系统(Automatic Identification System,AIS)等助航设施,导致涉事船舶间无法沟通;其三是船舶未遵守船舶报告制度,船舶交通服务系统(Vessel Traffic Service,VTS)难以提醒和实施有效监管。
图10中,墨蓝色点、浅绿色点为“冷点”(Cold Spot),代表小事故等级聚类的地方;黄色点代表特征不显著(Not Significant)的点。颜色的不同深浅,对应不同的置信点,颜色越深代表置信水平越高。由于重大事故等级事故比例较小,无法形成严重等级事故聚类,故热点不存在。小事故等级聚类分布在东海海域,该处显示为低值聚类。图中可以看出在东海海域、厦门湾、西海海域、同安湾部分区域,交通事故点等级无显著差异,在事故严重程度这一特性上呈现出聚类分布的趋势。由图910可知,小事故发生的地点通常与重大事故的发生有一定的空间关联性,若不及时处理及改善小事故的发生情况,最终有可能导致影响巨大的重大事故发生。

3.6 基于随机森林算法的厦门湾及周边水域风险预测模型

本文使用AIS数据对该地区交通状况进行统计,在该水域及其周边水域建立100×100标准化统计网格。网格内维度分别为通过网格的船舶流量、船舶的平均长度、宽度,航向和速度的标准差以及平均速度。选取训练样本时,将“发生过事故”的网格标记为负样本,“未发生事故”的网格标记为正样本。由于负样本数量仅为60,与总量为10 000的网格总数相比存在极度不平衡性,为避免模型对正样本数据产生过拟合现象,本文从10 000条数据中采取随机采样的方式抽取部分正样本,使正负样本比例达到10:1,方便模型学习负样本特征。再将此部分数据按8:2的比例划分训练集和测试集,由此完成训练数据的组织工作。最后,将数据集输入随机森林模型,得到最后的预测结果。
本文产出的模型采用受试者工作特征曲线(Receiver Operating Characteristic Curve,ROC)作为评价指标。受试者工作特征曲线常用来衡量分类的准确度,ROC值越接近1说明模型效果越好。最终结果如图11所示,ROC积分值为0.85,说明模型结果已达到了较高的分类准确度水平。
图11 受试者工作特征曲线

Fig. 11 Receiver operating characteristic curve

图12是厦门湾及周边水域的预测风险网格图,由图可知事故风险区域多位于沿海和河口。图中较明显的风险区域共有5个:
图12 厦门湾及周边水域事故可能发生风险网格

Fig. 12 Grid diagram of possible risks of accidents in Xiamen Bay and surrounding waters

(1)方框1是古雷半岛及六鳌半岛外海。该区域靠近东山渔场与台湾海峡南北内航路,密集的渔船对船舶的正常航行影响较大;
(2)方框2是漳州地区九龙江河口。该区域河道较窄且邻近正在扩建漳州招商港区,流量局部密度较大,增加了河船和海船会遇风险;
(3)方框3是厦门港同安湾。该区域目前分布多个在建基础设施工程,拖轮、工程船穿行较多,存在会遇风险;
(4)方框4是金门岛西侧。该区域靠近厦门港出港主航路,故存在出港船舶与大型船舶会遇碰撞的风险;
(5)方框5是泉州湾近惠安沿岸区域。该地区邻近惠安渔港,且有多个海上工程项目在施工,存在事故风险。
总体而言,密度分析无需复杂的算法即可获得关于海上交通事故空间分布的信息,可帮助海事部门清晰直观了解海上交通事故分布的空间特征。其不足之处是,密度分析结果只能反映事故严重程度分布的粗略情况。而空间自相关分析的结果可以精确到事故点,刚好补足了密度分析的不足,能够识别严重程度中的异常值点,给出事故点聚类结果的可信度,得到具体分布结果。将已经得到的事故风险分布再结合随机森林预测模型,为船舶在该区域避免发生事故,做出预警。

4 结论

本文介绍了一种可用于海上事故分析的空间信息方法,主要利用核密度分析方法和空间自相关性分析对海上交通事故进行分析,得到事故频度与严重程度的空间分布特征以及区域风险值、聚类特性,最后结合随机森林算法建立事故预测模型,进行船舶是否容易发生事故的预测。本文以厦门港为例,得到以下结论:
(1)从地理空间角度分析,事故分布呈现聚集性且事故发生与港口地理空间上存在关联性。主要集聚中心为厦门湾和西海域,次要聚集中心为东海部分海域(翔安港区、大金门岛附近、北东水道、虎屿岛附近)。海事部门对于以上区域,可增派无人机和增加日常巡回次数,减少事故发生风险。
(2)从风险角度,整个厦门港区按照事故等级划分,事故分布多数无显著差异,以危害性小的小事故为主。基于Local Moran's I自相关分析方法可知,航道存在小事故包含重大事故的异常情况,原因在于该区域事故空间构成较为复杂。主要的高等级(小事故作为低等级参照)事故多发生于航道内,呈现“以低值为主,高值显著”特征。结合地理空间角度证明该区域虽以低级事故为主,但存在高等级事故突发的可能,故监管上不能存在侥幸心理。
(3)从事故预测结果来看,未来当船舶在进入橙色网格区域内时,发生事故的概率最大,相关部门要对网格高风险区域加强监管,以避免事故发生。
(4)该方法可以对海上事故的其他有效空间分析提供借鉴作用。目前,由于数据的限制以及空间分析方法的局限性,对事故空间分布特征分析还比较简略。下一步可以结合船舶AIS交通流、船舶事故时间等多源数据,对海上交通事故时空分布特征进行深入探究,建立事故时空预测模型,从而更有针对性地海上交通安全管理工作,不断提高船舶航行安全。

感谢上海海事大学胡勤友教授提供的AIS数据。

[1]
王焕新, 刘正江. 基于N-K模型的海上交通安全风险因素耦合分析[J]. 安全与环境学报, 2021, 21(1):56-61.

[ Wang H X, Liu Z J. Coupling analysis of the risk factors for the maritime transportation safety based on the N-K model[J]. Journal of Safety and Environment, 2021, 21(1):56-61. ] DOI: 10.13637/j.issn.1009-6094.2019.1683

DOI

[2]
沈贤达, 张洁, 郭辰, 等. 基于风险分析的海上风机基础安全性评价研究[J]. 水利学报, 2015, 46(S1):326-330.

[ Shen X D, Zhang J, Guo C, et al. Risk-based safety evaluation of foundations of offshore wind turbines[J]. Journal of Hydraulic Engineering, 2015, 46(S1):326-330. ] DOI: 10.13243/j.cnki.slxb.2015.S1.059

DOI

[3]
郑义彬, 杨慧慧, 倪荣. 基于系统动力学方法的江汉运河通航风险管理策略模拟及其效果分析[J]. 水运管理, 2021, 43(1):13-16,27.

[ Deng Y B, Yang H H, NI R. Simulation of navigation risk management strategy of Jianghan Canal based on system dynamics method and its effect analysis[J]. Shipping Management, 2021, 43(1):13-16,27. ] DOI: 10.13340/j.jsm.2021.01.004

DOI

[4]
张骞予, 杨家其. 基于ARERAC评价模型的水上交通安全风险源评估[J]. 水运管理, 2020, 42(7):35-40.

[ Zhang Q Y, Yang J Q. Assessment of water traffic safety risk sources based on ARERAC evaluation model[J]. Shipping Management, 2020, 42(7):35-40. ] DOI: 10.13340/j.jsm.2020.07.011

DOI

[5]
鲁峰, 李伟, 于仁海, 等. 可拓云评价模型在航道通航环境安全评价中的应用[J]. 天津航海, 2021(1):1-6.

[ Lu F, Li W, Yu R H, et al. Application of topo cloud evaluation model in safety evaluation of navigational environment of waterways[J]. TianJin HangHai, 2021(1):1-6. ]

[6]
虞盈, 兰培真. 基于灰色马尔科夫模型的福建辖区船舶交通事故预测[J]. 中国航海, 2017, 40(3):69-72.

[ Yu Y, Lan P Z. Vessel traffic accident prediction of Fujian area based on grey markov model[J]. Navigation of China, 2017, 40(3):69-72. ]

[7]
汪强. 基于组合模型的海上交通事故预测研究[J]. 钦州学院学报, 2019, 34(5):10-14.

[ Wang Q. A study of maritime traffic accidents prediction based on combination model[J]. Journal of Qinzhou University, 2019, 34(5):10-14. ]

[8]
徐东星, 尹勇, 张秀凤, 等. 基于改进三参数灰色模型的海上交通事故预测[J]. 中国航海, 2020, 43(1):12-17.

[ Xu D X, Yin Y, ZHANG X F, et al. Improved three-parameter grey model for prediction of marine traffic accidents[J]. Navigation of China, 2020, 43(1):12-17. ]

[9]
王清斌, 王文亮, 赵睿. 基于改进XGBoost算法的船舶事故风险与类型预测[J/OL]. 安全与环境学报,1-9[2021-11-16].

[ Wang Q B, Wang W L, Zhao R. Prediction of ship accident risk and type based on improved XGBoost[J/OL]. Journal of safety and environment, 1-9[2021-11-16. ] DOI: 10.13637/j.issn.1009-6094.2021.1040

DOI

[10]
Zhuang W X, Guo G P. Research and countermeasures on LNG ship port area navigation risk assessment based on Fuzzy comprehensive evaluation method[J]. IOP Conference Series: Earth and Environmental Science, 2021, 809,1. DOI: 10.1088/1755-1315/809/1/012008

DOI

[11]
Ung S.T. Navigation risk estimation using a modified bayesian network modeling-a case study in Taiwan[J]. Reliability Engineering and System Safety, 2021,213. DOI: https://doi.org/10.1016/j.ress.2021.107777

DOI

[12]
Zhao L B, Fu X J. A novel index for real-time ship collision risk assessment based on velocity obstacle considering dimension data from AIS[J]. Ocean Engineering, 2021,240. DOI: https://doi.org/10.1016/j.oceaneng.2021.109913

DOI

[13]
Dinis D, Teixeira A P, Guedes Soares C. Probabilistic approach for characterising the static risk of ships using bayesian networks[J]. Reliability Engineering and System Safety, 2020,203. DOI: https://doi.org/10.1016/j.ress.2020.107073

DOI

[14]
Ruan Q S, Luo F, et al. Design scheme of ship risk prediction model from the perspective of artificial intelligence[J]. Journal of Physics: Conference Series, 2021, 1982(1). DOI: 10.1088/1742-6596/1982/1/012062

DOI

[15]
Tiang F F, Yuen K K R, Lee E W M. Analysis of motorcycle accidents using association rule mining-based framework with parameter optimization and GIS technology[J]. Journal of Safety Research, 2020, 75:292-309. DOI: https://doi.org/10.1016/j.jsr.2020.09.004

DOI

[16]
Yafei L, Chen L, Alanin L. The analysis of spatial pattern and hotspots of aviation accident and ranking the potential risk airports based on GIS platform[J]. Journal of Advanced Transportation, 2018,2018. DOI: https://doi.org/10.1155/2018/4027498

DOI

[17]
Maher I S, Biswajeet P. Assessment of the effects of expressway geometric design features on the frequency of accident crash rates using high-resolution laser scanning data and GIS[J]. Geomatics, Natural Hazards and Risk, 2017, 8(2):733-747. DOI: https://doi.org/10.1080/19475705.2016.1265012

DOI

[18]
GHOLAM A S, AFSHIN F, MOHAMMAD S B. GIS-based spatial analysis of urban traffic accidents: Case study in Mashhad, Iran[J]. Journal of Traffic and Transportation Engineering(English Edition), 2017, 4(3):290-299. DOI: https://doi.org/10.1016/j.jtte.2017.05.005

DOI

[19]
Mohammad A A, Reza S D, et al. Applying GIS to identify the spatial and temporal patterns of road accidents using spatial statistics (case study: Ilam Province, Iran)[J]. Transportation Research Procedia, 2017, 25:2126-2138. DOI: https://doi.org/10.1016/j.trpro.2017.05.409

DOI

[20]
Murat S C, Ozan A. A GIS approach to evaluate infrastructure variables influencing the occurrence of traffic accidents in urban roads[J]. International Journal of Environment and Geoinformatics, 2017, 4(1):17-24. DOI: 10.30897/ijegeo.306488

DOI

[21]
阚小溪, 高悦尔, 杨春, 等. 路网形态对城市购物中心布局的影响—以福建厦门岛为例[J]. 地域研究与开发, 2021, 40(2):68-73.

[ Kan X X, Gao Y E, Yang C, et al. Influence of road network form on layout of urban shopping center: A case study of Xiamen island in Fujian Province[J]. Arear Research and Development, 2021, 40(2):68-73. ]

[22]
陆化普, 罗圣西, 李瑞敏. 基于GIS分析的深圳市道路交通事故空间分布特征研究[J]. 中国公路学报, 2019, 32(8):156-164.

DOI

[ Lu H P, Luo S X, Li R M. GIS-based spatial patterns analysis of urban road traffic crashes in ShenZhen[J]. China Journal of Highway and Transport, 2019, 32(8):156-164. ] DOI: 10.19721/j.cnki.1001-7372.2019.08.014

DOI

[23]
邢晓语, 杨秀春, 徐斌, 等. 基于随机森林算法的草原地上生物量遥感估算方法研究[J]. 地球信息科学学报, 2021, 23(7):1312-1324.

DOI

[ Xing X Y, Yang X C, Xu B, et al. Remote sensing estimation of grassland aboveground biomass based on random forest[J]. Journal of Geo-information Science, 2021, 23(7):1312-1324. ] DOI: 10.12082/dqxxkx.2021.200605

DOI

[24]
方秀琴, 郭晓萌, 袁玲, 等. 随机森林算法在全球干旱评估中的应用[J]. 地球信息科学学报, 2021, 23(6):1040-1049.

DOI

[ Fang X Q, Guo X M, Yuan L, et al. Application of random forest algorithm in global drought assessment[J]. Journal of Geo-information Science, 2021, 23(6):1040-1049. ] DOI: 10.12082/dqxxkx.2021.200474

DOI

[25]
柳林, 刘文娟, 廖薇薇, 等. 基于随机森林和时空核密度方法的不同周期犯罪热点预测对比[J]. 地理科学进展, 2018, 37(6): 761-771.

DOI

[ Liu L, Liu W J, Liao W W, et al. Comparison of random forest algorithm and space-time kernel density mapping for crime hotspot prediction[J]. Progress in Geography, 2018, 37(6):761-771. ]

[26]
中华人民共和国福建海事局.[EB/OL]. http://www.fj.msa.gov.cn/ 2021-08-04.

[ Fujian Maritime Safety Administration of People's Republic of China.[EB/OL]. http://www.fj.msa.gov.cn/ 2021-08-04. ]

[27]
水上交通事故统计办法[J]. 中华人民共和国国务院公报. 2015(1):44-47.

[Statistical Measure of Water Transport Accidents[J]. Gazette of the State Council of the People's Republic of China, 2015(1):44-47 ]

[28]
李佳, 古腾飞, 金磊, 等. 兴趣点定位的餐饮业空间特征分析方法[J]. 导航定位学报, 2021, 9(2):54-61.

[ Li J, Gu T F, Jin L, et al. Analysis method of spatial characteristics of catering industry based on location of point of interest[J]. Journal of Navigation and Positioning, 2021, 9(2):54-61. ] DOI: 10.16547/j.cnki.10-1096.20210209

DOI

[29]
蒋海兵, 李业锦. 京津冀地区制造业空间格局演化及其驱动因素[J]. 地理科学进展, 2021, 40(5):721-735.

DOI

[ Jiang H B, Li Y J. Change of spatial structure of manufacturing industry in the Beijing-Tianjin-Hebei region and its driving factors[J]. Progress in Geography, 2021, 40(5):721-735. ]

[30]
上海海事大学.[ EB/OL]. https://www.shmtu.edu.cn/ 2021-08-04.

[Shanghai Maritime University.[EB/OL]. https://www.shmtu.edu.cn/ 2021-08-04. ]

[31]
Zhang B B, Wu S, Cheng S F, et al. Spatial characteristics and factor analysis of pollution emission from heavy-duty diesel trucks in the Beijing-Tianjin-Hebei region, China[J]. International Journal of Environmental Research and Public Health, 2019, 16:4973. DOI: 10.3390/ijerph16244973

DOI

文章导航

/