Harbor Detection based on Multi-Source Data and Semantic Modeling of Ship Stop Trajectory

  • YAN Zhaojin , 1, 2 ,
  • YANG Hui , 1, 2, 3, *
Expand
  • 1. School of Resources and Geosciences, China University of Mining and Technology, Xuzhou 221116, China
  • 2. Key Laboratory of Coal Bed Gas Resources and Forming Process of Ministry of Education, China University of Mining and Technology, Xuzhou 221116, China
  • 3. Artificial Intelligence Research Institute, China University of Mining and Technology, Xuzhou 221116, China
* YANG Hui, E-mail:

Received date: 2021-08-21

  Revised date: 2021-10-27

  Online published: 2022-11-25

Supported by

The Fundamental Research Funds for the Central Universities(2022-11242)

National Natural Science Foundation of China(41971335)

National Natural Science Foundation of China(51978144)

A Project Funded by the Priority Academic Program Development of Jiangsu Higher Education Institutions.

Abstract

Harbor detection is the top priority of maritime ship supervision, and the ship activity information acquired by Automatic Identification System (AIS) can provide high temporal and spatial accuracy of ship activity information for harbor detection. In order to explore the application of AIS data in harbor detection, a harbor detection method based on multi-source data and semantic modeling of ship stop trajectory is proposed. Firstly, the semantic model of ship stop trajectory is constructed through data mining and semantic information enhancement to identify ship stop trajectory in the harbor area. Secondly, a classification model based on random forest is established to classify ship berthing trajectories and ship anchoring trajectories, and then harbor berths and anchorages are extracted by using spatial step-by-step merging method. Finally, the data of ship berthing trajectories, roads, coastline, bathymetry, and land use and land cover data are integrated to identify harbor objects considering situational-domain knowledge. Based on over 83 million AIS trajectory records of 96,790 ships in 2017, the proposed method is applied to detect harbor object in the South China Sea study area. The experimental results show that the overall classification accuracy of ship stop behavior is 0.9477 and the Kappa coefficient is 0.8948. 447 harbor areas in the South China Sea study area are extracted, and the overlay verification results with Google Earth images show that the extraction results are all located within the real harbor images. In addition, compared with the 24 harbor locations in the South China Sea region contained in the Natural Earth dataset, the integrity of the extraction results is greatly enhanced. Therefore, the harbor detection method based on multi-source data and semantic modeling of ship stop trajectory has high accuracy and completeness for harbor detection. Meanwhile, the harbor areas extracted by this method can provide target areas for harbor identification based on remote sensing images, thus improving the efficiency of dynamic identification of harbor object in a large region or even globally.

Cite this article

YAN Zhaojin , YANG Hui . Harbor Detection based on Multi-Source Data and Semantic Modeling of Ship Stop Trajectory[J]. Journal of Geo-information Science, 2022 , 24(9) : 1662 -1675 . DOI: 10.12082/dqxxkx.2022.210471

1 引言

海上交通监测是保证海上航行安全的重要手段[1]。作为海上运输的载体,感知船舶的行为对海上航行安全起着决定性作用[2]。相对于公海而言,港口区域面临日益增加船舶密度的压力更大,并且由于其受到空间制约和毗邻城市区,一旦发生船舶事故导致的经济、环境等损失更大[3-4]。船舶活动在港口区域的一个重要状态就是停留,而停留往往对应了泊位靠泊或锚地抛锚,从而形成了港口两类特征区域-泊位和锚地。泊位是港口码头专供船舶停靠系泊的岸线位置,锚地是港区供船舶水上安全停泊以及进行其他作业必要停靠的水域[5-6]。港口船舶停留区域是连接海上运输的关键节点,识别港口船舶停留区域对于海上交通监测、港口运营管理、港区航行安全具有重要意义。
当前针对港口目标识别的工作主要集中于利用遥感影像或SAR影像进行港口周边目标的识别,包括港口、码头、船舶等目标的识别。如基于深度学习的方法构建适用于遥感影像港口周边目标识别的学习网络,实现港口、码头、船舶等目标的检测[7-11]。此外,SAR影像对于船舶目标检测具有良好的性能,多种适用于SAR影像的船舶检测算法已被提出[12-15]
船舶轨迹表征了船舶活动的动态信息,往往隐含着丰富的地理语义,如船舶停留多发生在港口区域,为港口目标识别提供了一种新思路。船舶自动识别系统(Automatic Identification System,AIS)是一种监控船舶位置和状态的自报告系统,可以获取船舶细粒度的轨迹信息,其更新频率可达秒级,是一种理想的船舶活动研究数据[2]。由于船舶在航行与停留时表现出不同的行为,并且即便同属于停留状态,船舶在泊位靠泊或锚地抛锚时仍然表现出不同的特征,这都为基于AIS数据识别港口目标提供了可能。因此,感知船舶轨迹的行为,挖掘船舶停留时的模式和规律可以指导港口目标的识别,以及港口泊位和锚地的分类。
当前研究者对AIS数据挖掘进行了大量探索,已在AIS船舶轨迹处理、轨迹压缩、船舶避碰、异常检测、交通流特征、轨迹预测、船舶排放等取得一定的成果[16]。船舶轨迹行为感知最常用的方法是基于特征统计的方法[1],即通过船舶轨迹统计特征对船舶行为进行分类,如通过速度趋于零这一特征指标来识别船舶的停留行为[2]。由于没有考虑相关背景信息(如地学关系),利用统计方法得到的船舶行为很难描述或解释这一行为的含义,不利于深层次船舶行为的挖掘和知识发现。一个简单的实例,对于利用统计方法得到的船舶停留,很难区分当前停留是泊位停留、锚地停留还是其他停留行为。由于船舶轨迹具有高时空信息、低语义信息的特点,因此,需要一种更具语义信息的船舶行为感知方法实现港口船舶活动行为的分类,从而提取船舶港口停留轨迹来实现港口目标识别。
语义轨迹源自轨迹知识发现,通过对原始轨迹的挖掘将船舶轨迹特征转化成一系列具有属性和相互关系的语义概念,从而赋予轨迹丰富的语义信息,发现原始轨迹中隐含的知识[17]。语义轨迹最早应用于陆路交通,其中研究行人出行行为的“stop-move”模型[18]是应用最为广泛的语义轨迹模型。随后,针对船舶语义轨迹的建模开展了一系列的尝试,如Van Hage等[19]提出了用于海上态势感知的“Simple Event Model”(SEM)船舶语义轨迹模型,可以用于推断船舶的异常行为。Yan等[2]提出了“stop-move-stop”的船舶语义轨迹模型用于简化提取海上交通模式。然而,现有语义建模方法较少考虑多源数据对于船舶轨迹语义建模带来的有利辅助作用。
港口位置符合一定的地学关系,如港口位于海岸线、港内水文需满足一定条件等,这些知识显然可以用于辅助港口目标的识别。需要指出的是,本文研究的港口特指海港。此外,现有研究并没有针对港口船舶停留行为的研究,鲜有利用船舶轨迹数据进行港口目标识别的尝试。为了填补现有研究存在的缺陷,提出一种基于多源数据和船舶停留轨迹语义建模的港口目标识别方法。①从离散的船舶轨迹点出发,挖掘船舶轨迹数据的数据特征和船舶活动状态转变的关键点,识别船舶在港口区域的停留,分析船舶停留点处的地理情景,增强船舶活动的地理情景和语义知识。②建立船舶停留轨迹语义模型,提取船舶港口停留轨迹,顾及情景-领域知识确定船舶泊位停留和锚地停留分类的特征变量,分类船舶港口停留方式,并提取港口泊位和锚地区域。③在港口情景知识的指导下,综合多源数据实现港口目标检测。本研究的创新点主要体现在:① 顾及情景-领域知识的港口目标识别方法。综合AIS数据、水深数据、道路数据、海岸线数据、土地利用与土地覆盖数据(LUCC)等,在情景-领域知识的指导下,如港口位于海岸线、港口与道路相连、港口陆地区域为不透水面等知识,实现港口目标的提取; ② 建立适用于港口情景的船舶停留轨迹语义模型。基于船舶停留轨迹语义模型识别船舶港口停留轨迹,分类船舶泊位停留和锚地停留,提取港口泊位区域和锚地区域。港口泊位和锚地区域的识别可为港口经营与管理、港口安全航行路线规划等提供有益参考。

2 基于多源数据和船舶停留轨迹语义建模的港口目标识别方法

2.1 技术路线及数据来源

综合LUCC、地理信息数据(海岸线、道路)、水深数据和AIS数据,顾及港口目标的情景特性和空间特征,提出一种利用多源数据和船舶停留轨迹语义建模的港口目标识别方法(图1),其算法流程如下:
图1 基于多源数据和船舶停留轨迹语义建模的港口识别方法框架

Fig. 1 Harbor object detection method framework based on multi-source data and semantic modeling of ship stop trajectory

(1)船舶停留轨迹提取。通过船舶轨迹数据特征挖掘和语义知识发现,丰富船舶活动语义信息,构建面向港口停留区的船舶停留轨迹语义模型,提取船舶港口停留轨迹。
(2)船舶停留方式分类。顾及情景-领域知识,从轨迹特征和地理情景2个维度,选取船舶港口停留方式分类特征,构建基于随机森林的船舶停留方式分类模型,分类船舶泊位停留和锚地停留轨迹。
(3)港口目标识别。在港口位于海岸线、港口与道路相连、港口水域停靠有船舶等情景-领域知识约束下,综合船舶泊位停留轨迹、LUCC、水深、道路、海岸线等数据,提取港口目标。
表1为研究数据概述。利用坐标转换,将不同数据源的空间坐标统一转换为WGS84地理坐标系统,因实验区为南海区域,故设定标准纬线为6°N和18°N,中央经线为110°E,进行正轴等角割圆锥投影;利用重采样,统一以10 m分辨率的栅格单元大小对不同栅格数据进行重采样;利用地理格网分析,将船舶轨迹点、海岸线、道路等矢量数据以年尺度的统计量进行格网映射,从而转换为10 m分辨率的栅格图层。基于此,实现不同数据源时空尺度的统一。
表1 研究数据概述

Tab. 1 An overview of the research data

数据名称 覆盖时间/年 空间覆盖 数据精度 数据格式 数据来源
AIS数据 2017 全球海域 定位精度0.0001° 数据库文件 ExactEarth
LUCC 2017 全球 10 m 栅格文件 清华大学FROM-GLC10[20]
海岸线 2017 全球 10 m ShapeFile矢量文件 Natural Earth[21]
道路网 2017 全球 约为10 m ShapeFile矢量文件 OpenStreetMap[22]
水深产品 2019 全球 15 ' ' 栅格文件 GEBCO_2019 Grid[23]
遥感影像 - 全球 - 影像文件 Google Earth[24]
基于港口目标的特性得到如下知识:① 港口陆地区域为不透水面;② 港口位于海岸线;③ 港口有道路连接;④ 港内停靠有船舶。通过空间分析可知,在一定海岸线缓冲区内,有道路连接且在一定范围内有船舶停留的不透水面区域为港口区域,本研究提取的港口目标以港口区域作为结果表现形式,即:
P H = P L P C P R P A
式中: P H为港口区域; P L为不透水面,来自于清华大学2017年全球10 m分辨率的LUCC产品FROM-GLC10数据集[20],通过筛选土地利用类型为不透水面得到,由于LUCC数据为离散格网数据,为了得到不透水面的连通区域,采用八邻域方法进行合并; P C为0.5 km的海岸线缓冲区,海岸线图层来自于Natural Earth的2017年全球10 m分辨率海岸线数据集[21]; P R为道路图层,来自于OpenStreetMap的2017年全球道路网数据集[22]; P A为船舶泊位停留轨迹,主要从2017年的AIS数据中获取,在船舶泊位停留行为识别时会辅以水深数据和海岸线数据,利用数据挖掘方法进行领域约束,船舶泊位停留轨迹由船舶停留轨迹经过船舶泊位停留和船舶锚地停留行为分类后得到,因此船舶泊位停留与锚地停留分类成为港口目标提取的前提; A B指图层A与图层B相交。

2.2 船舶停留轨迹语义模型构建

AIS原始轨迹中记录了船舶高时相和高精度的活动信息,包括每个轨迹点的地理位置、速度、航向,以及与船舶相关的静态信息、与船舶航次相关的行程信息等。尽管AIS数据具有丰富的时空特征,但是仅依靠时空特征信息很难真正理解船舶的行为和隐含的知识。因此,提出一种挖掘船舶活动行为的语义模型,丰富船舶轨迹的语义信息,实现对船舶活动行为的理解。
船舶停留轨迹语义模型(Ship Stop Trajectory Semantic Model,SSTSM)面向船舶个体感知其活动隐含的知识,SSTSM由静态信息、动态信息、时间、轨迹、状态、行为和语义场景7个子部分以及各子部分之间的联系组成(图2),其数学表达式如下:
S S T S M i j = s t a s t i c j , d y n a m i c j , t i m e j , t r a c k j , s t a t e j , b e h a v i o r j , s e n m a t i c P l a c e j
式中: S S T S M i j表示船舶 j的第 i个船舶停留语义轨迹; s t a s t i c j为静态信息,记录了船舶 j的身份信息、船舶尺寸和类型,从而对船舶进行唯一标识,用于提取单艘船舶的轨迹; d y n a m i c j为动态信息,表示船舶 j的位置和速度,其中船舶速度是区分船舶状态的重要指标; t i m e j为时间,代表了船舶轨迹点报告的时间,通过时间序列易于获取船舶轨迹活动的开始时间和结束时间; t r a c k j是指船舶 j的活动轨迹,借鉴“stop-move”模型[18]的思想,将船舶轨迹划分成停留子轨迹和移动子轨迹; s t a t e j表示船舶 j的运动状态,其中停留子轨迹对应了船舶停留状态,移动子轨迹对应了船舶移动状态; b e h a v i o r j表征了船舶 j在某种状态下船舶的行为模式,对于船舶在港内的静止行为,可以根据其行为特征,进一步分类泊位停留行为和锚地停留行为; s e n m a t i c P l a c e j为语义场景,即船舶在做出某种行为时发生的地点,本研究主要针对港口区域的船舶活动,因此语义场景只区分港口和公海(非港口),基于船舶的泊位停留行为和锚地停留行为,还可将港口停留场景进一步区分为泊位场景和锚地场景。
图2 港口船舶停留轨迹语义模型

注:绿色矩形框表示SSTSM模型,橙色矩形框为该模型的7个子部分,蓝色矩形框为每个子部分包含的属性。

Fig. 2 Semantic model of ship stop trajectory in the harbor area

2.3 船舶港口停留轨迹确定

船舶轨迹表示为该船舶一系列时序轨迹点的集合,即 T = ( p t 1 , p t 2 , , p t n ),其中, p t i表示船舶在时间 t i的轨迹点, p t i = ( x i , y i , v i , t i , i n f o ),其中, x i y i为船舶在时刻 t i时的位置, v i是船舶在时刻 t i时的速度, i n f o为船舶的静态信息,包括船舶识别码MMSI、船名、船舶类型、船舶尺寸等。船舶活动具有停留和移动两种状态,故船舶轨迹可以看作由一系列停留子轨迹和移动子轨迹组成,即 T = T S , T M,其中, T S为船舶停留子轨迹的集合, T S = T S 1 , T S 2 , , T S n, T S i为船舶第 i个停留子轨迹, T S i由一系列船舶停留时序点组成,即 T S i = ( s t 1 , s t 2 , , s t n ),其中 s t i为船舶停留点,即船舶此时为停留状态; T M为船舶移动子轨迹的集合,其定义与 T S类似,船舶移动子轨迹由一系列船舶移动时序点组成。当船舶速度趋于0时,认为船舶为停留状态。由于船舶在水中无法实现完全静止,故一般认为船舶速度小于1节时,船舶处于停留状态。船舶港口停留轨迹是 T S的子集,即只保留船舶停留子轨迹 T S i为船舶在港口区域停留的轨迹。
船舶停留子轨迹是否为船舶港口停留子轨迹需基于情景-领域约束知识进行判别:① 船舶在港口区域停留时,其所处水深小于一定阈值,由于深水港的水深一般为15~20 m,因此水深阈值应大于20 m,本研究将水深阈值设置为30 m;② 船舶在港口区域停留时,船舶与海岸线的距离应小于一定阈值,本文将距离阈值设为10 km,即:
T S i = 1 , d e p t h T S i < d T d i s t a n c e T S i < l T 0 ,
式中: T S i = 1表示船舶停留子轨迹 T S i为停留在港口区域的船舶子轨迹; T S i = 0表示 T S i停留的区域为非港口区域; d e p t h T S i T S i停留处的水深,这里用 T S i中心点所处的水深值表示,通过将中心点与水深数据进行叠加得到,水深数据为GEBCO的全球网格水深数据集[23], T S i中心点所在水深数据网格的水深值为 T S i停留处的水深; d T为水深阈值; d i s t a n c e T S i表示 T S i中心点与海岸线的最近距离; l T为与海岸线距离阈值。基于此,实现了船舶港口停留轨迹的识别。

2.4 船舶港口停留行为分类

船舶港口停留子轨迹虽然都处于停留状态,但泊位停留和锚地停留依然显示出不同的行为特征,因此基于数据挖掘方法,顾及港口泊位和锚地情景的差异,构建泊位和锚地领域约束,实现船舶泊位停留和锚地停留的分类。船舶停留行为的分类从数据挖掘的角度,属于模式识别的范畴。机器学习算法是模式识别常用的技术手段,而随机森林算法具有高效、简单、抗拟合能力强、可以处理高维度数据等特点,是一种常用的机器学习分类方法。随机森林算法由Breiman等[25]提出,以决策树为基本单元,通过集成学习的思想将多棵决策树集成在一起,本质上是基于机器学习的一种集成学习算法。由于每棵决策树都是一个分类器,当输入训练样本后,每棵决策树都会产生对应的分类结果。随后随机森林算法收集每棵树的分类结果,采用投票方式决定样本的分类结果。利用随机森林算法构建船舶港口停留行为分类模型,实现船舶泊位停留和锚地停留的分类。基于随机森林的船舶港口停留行为分类方法的流程如下。
(1)训练样本制作
基于2.3节识别的船舶港口停留轨迹制作船舶泊位停留子轨迹样本与船舶锚地停留子轨迹样本,利用Google Earth软件[24]提供的遥感影像辅助人工标记船舶泊位停留和锚地停留样本。训练样本制作时考虑船舶类型和空间分布的影响,对AIS数据中包含的所有船舶类型的港口停留轨迹进行样本制作,并均匀分布于研究区。
(2)分类特征选取
基于情景-领域知识进行船舶港口停留轨迹分类特征选取,既考虑船舶轨迹自身的特征信息,又顾及泊位情景和锚地情景的领域知识。用于分类船舶泊位停留轨迹和锚地停留轨迹的特征主要分为2类:
(1)船舶轨迹数据特征。船舶在泊位靠泊时,为了装卸货物或上下客的需要,一般尽可能保持固定状态;而在锚地抛锚状态下,船舶往往是固定一端,由于风浪流的作用,船舶在锚地抛锚时易发生漂移运动。船舶在泊位靠泊或锚地抛锚时,船舶停留子轨迹的速度、航向、距离、轨迹点形状呈现出不同特征。因此,用于船舶泊位停留和锚地停留分类的船舶停留轨迹数据特征为:轨迹点的平均速度、速度方差、速度标准差、速度离散系数、平均航向、航向方差、航向标准差、航向离散系数、平均距离、距离方差、距离标准差、距离离散系数、轨迹点之间的最大距离以及圆形度。
(2)情景-领域知识特征。泊位情景和锚地情景存在不同的制约条件,这为船舶泊位停留和锚地停留的分类提供了领域知识。泊位是港口码头专供船舶停靠系泊的岸线位置,而锚地可以是港内水域也可以为港外水域,但一般远离岸线,故与海岸线的距离可以用作船舶泊位停留和锚地停留的分类特征。另外,船舶一般不能长时间占用泊位,而锚地抛锚少有时间限制,因此船舶停留轨迹的停留时间也可作为分类特征。
(3)船舶停留行为分类
基于随机森林算法构建船舶停留行为分类模型,训练样本按照8:2的分割比例分为训练集和验证集。输入训练集训练分类模型,当船舶停留行为分类模型训练结束后,使用验证集评估分类模型的分类效果。最后,对研究区内待分类的船舶港口停留轨迹进行分类,得到船舶泊位停留轨迹和船舶锚地停留轨迹。

2.5 港口泊位和锚地提取

船舶泊位停留轨迹和船舶锚地停留轨迹分类后,利用空间相邻逐级合并方法分别提取港口泊位和锚地。泊位提取与锚地提取的方法相同,因此以泊位提取为例,介绍空间相邻逐级合并方法。对于船舶泊位停留轨迹,首先将每个船舶泊位停留子轨迹生成凸包多边形作为判断空间邻接的基础。然后判断任意2个凸包多边形是否存在空间邻接关系,这里定义2个凸包多边形存在相交或包含关系时,即认为这2个凸包多边形存在空间邻接关系。若存在空间邻接关系,则将这2个泊位停留子轨迹合并成一个新的泊位停留子轨迹,然后以合并之后的停留子轨迹生成凸包多边形作为这2个泊位停留子轨迹共同的空间区域。接着,依次判断其他船舶泊位停留子轨迹凸包多边形的空间邻接关系,逐级合并得到最终的泊位区域。空间相邻逐级合并方法是船舶停留轨迹空间范围逐级扩张的过程。图3示意了4个船舶泊位停留子轨迹的逐级合并过程,其方法流程为 a b c d
图3 船舶泊位停留子轨迹的逐级合并示意

Fig. 3 Schematic diagram of spatial adjacent step-by-step merging of ship berthing trajectories

3 案例分析

3.1 实验区与数据

以南海区域为实验区,验证基于多源数据和船舶停留轨迹语义建模的港口目标识别方法的有效性。研究区空间范围(图4)为3.3°S—23.8°N,95.4°E—122.3°E,包含了南海、马六甲海峡和泰国湾。研究区周边国家包括中国、越南、柬埔寨、泰国、马来西亚、新加坡、印度尼西亚、文莱、菲律宾。AIS船舶轨迹数据为研究区内2017年1月1日—2017年12月31日96 790艘船舶的超8300万条轨迹记录。其中,2017年1月1日研究区内船舶AIS轨迹点的空间分布如图4所示。AIS记录包含了船舶的MMSI号、IMO号、船名、呼号、船舶类型、船舶长度、船舶宽度、目的地、预计到达时间、吃水、经度、纬度、对地航速、对地航向、船首向、航行状态、UTC时间等。不同船舶根据MMSI进行区分,表2展示了MMSI为565229000,船名为SIMA SAPPHIRE的集装箱船的10条真实AIS轨迹记录。本研究用到的AIS数据包含了15种船型,分别为散货船、集装箱船、渔船、气槽船、普通货船、海洋工程船、油轮、其他液货船、客轮、滚装船、游船、服务船、专用货船、拖船、其他。
图4 南海区域研究区与AIS数据示例

注:该图基于自然资源部标准地图服务网站下载的审图号为GS(2021)5453的标准地图制作,底图无修改。

Fig. 4 Example of South China Sea regional study area and AIS data

表2 集装箱船AIS轨迹记录示例

Tab. 2 Example of real AIS trajectory recording of a container ship whose MMSI is 565229000, and named SIMA SAPPHIRE

MMSI号 船舶名称 船舶类型 船舶长度/m 船舶宽度/m 经度/° 纬度/° 对地航速/节 对地航向/° UTC时间
565229000 SIMA SAPPHIRE 集装箱船 170 25 100.76 13.12 0.1 340 2017-07-03/00:20:27
565229000 SIMA SAPPHIRE 集装箱船 170 25 100.76 13.12 0 195 2017-07-03/01:29:27
565229000 SIMA SAPPHIRE 集装箱船 170 25 100.76 13.12 0 357 2017-07-03/02:32:26
565229000 SIMA SAPPHIRE 集装箱船 170 25 100.76 13.11 7.2 219 2017-07-03/03:16:04
565229000 SIMA SAPPHIRE 集装箱船 170 25 100.74 13.03 14.9 175 2017-07-03/03:38:00
565229000 SIMA SAPPHIRE 集装箱船 170 25 100.74 12.87 14.7 180 2017-07-03/04:16:11
565229000 SIMA SAPPHIRE 集装箱船 170 25 100.73 12.76 14.8 187 2017-07-03/04:44:05
565229000 SIMA SAPPHIRE 集装箱船 170 25 100.76 12.63 15.2 142 2017-07-03/05:16:11
565229000 SIMA SAPPHIRE 集装箱船 170 25 100.81 12.53 15.1 151 2017-07-03/05:44:05
565229000 SIMA SAPPHIRE 集装箱船 170 25 100.90 12.42 15.3 141 2017-07-03/06:16:12

注:示例船舶MMSI为565229000,船名为SIMA SAPPHIRE。

3.2 船舶停留轨迹识别

基于船舶港口停留轨迹语义模型和船舶港口停留轨迹提取方法,对2017年研究区的船舶港口停留轨迹进行识别,共得到349 757个船舶港口停留轨迹。不同船型的停留轨迹数量及占比如图5所示。研究区内油轮停留轨迹的占比最高,为37.76%,集装箱船次之,占比19.59%。这两种船型的停留轨迹数量超过了研究区内所有船舶停留轨迹数量的一半以上。渔船占比最少,仅为0.08%,这是由于IMO规定从事国际航行且总吨超过300的商船(非客船)才需装备AIS设备[26],而数量繁多的近海作业小渔船(总吨小于300)并没有装备AIS设备,因此研究区内渔船的停留轨迹最少。
图5 研究区内不同船型停留轨迹统计

Fig. 5 Statistics of ship stop trajectories of different ship types in the study area

3.3 船舶停留行为分类

3.3.1 泊位停留轨迹样本和锚地停留轨迹样本

利用船舶港口停留轨迹和Google Earth高分辨率同时相影像,随机选取2015个船舶停留轨迹作为样本数据,并标记该停留轨迹的停留行为:泊位停留或锚地停留,其中1080个样本为泊位停留轨迹,935个样本为锚地停留轨迹。样本选取时顾及了船舶类型的影响,不同类型船舶的泊位停留轨迹样本或锚地停留轨迹样本与不同类型船舶的停留轨迹数量之间的比例基本保持一致。不同类型船舶停留轨迹分类样本实例如图6所示,其样本数量统计见表3
图6 不同类型船舶的泊位停留轨迹样本和锚地停留轨迹样本

Fig. 6 Examples of ship berthing trajectory samples and ship anchoring trajectory samples for different types of ships

表3 不同类型船舶停留轨迹样本统计

Tab. 3 Sample statistics for different types of vessel stop trajectories (个)

样本类型 船舶类型 合计
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
泊位停留 174 176 177 35 91 46 44 44 46 48 43 41 40 33 42 1080
锚地停留 151 140 127 43 79 31 35 36 44 40 43 45 42 39 40 935
合计 325 316 304 78 170 77 79 80 90 88 86 86 82 72 82 2015

注:编号1—15分别表示集装箱船、油轮、散货船、客轮、普通货船、滚装船、气槽船、其他液货船、渔船、专用货船、拖船、游船、海洋工程船、服务船、其他。

3.3.2 船舶停留轨迹分类精度

采用不放回的随机抽样,根据8:2的比例将 2015个船舶停留轨迹样本分为训练集(1612,表示样本数量,下同)和验证集(403),以评估所提方法对船舶停留轨迹分类的精度。以100次随机抽样对验证集分类结果的平均值作为模型最终的分类精度,计算船舶停留轨迹分类后的总体分类精度、船舶泊位停留轨迹分类精度和船舶锚地停留轨迹分类精度,以及Kappa系数(表4)。
表4 基于随机森林算法的船舶停留轨迹分类统计

Tab. 4 Classification accuracy of ship stop trajectory based on random forest algorithm

船舶停留轨迹 船舶停留轨迹分类验证精度
样本数量/个 2015 总体精度 0.9477
训练集/个 1612 泊位停留识别精度 0.9561
验证集/个 403 锚地停留识别精度 0.9352
训练:验证 8:2 Kappa系数 0.8948
表4可知,船舶停留轨迹总体分类精度为0.9477,Kappa系数为0.8948。表明该方法可以对船舶停留轨迹进行有效分类,并且具有较高的稳定性。船舶泊位停留轨迹和船舶锚地停留轨迹的分类精度与总体分类精度相对一致,船舶泊位停留轨迹的分类精度(0.9561,表示分类精度,下同)略高于船舶锚地停留轨迹的分类精度(0.9352)。
利用平均精度下降(Mean Decrease in Accuracy,MDA)和平均Gini系数下降(Mean Decrease in Gini Index,MDG)指标[27]对船舶停留行为分类的16个特征变量进行重要性评估,如图7所示。
图7 基于MDA指标和MDG指标评估特征变量重要性

Fig. 7 Importance of characteristic variables under MDA indicator and MDG indicator

经分析可知,2种指标下不同特征变量的重要性排名存在差异。具体而言,对于MDA指标,相邻船舶停留轨迹点间的平均距离的重要性排名最高,其次是航向离散系数,接着是船舶轨迹最大距离、距离方差、距离标准差、平均速度等,特征变量重要性最小的是停留时间。对于MDG指标,相邻船舶停留轨迹点间的平均距离和航向离散系数与MDA指标下的重要性一致,依然是重要性排名最高的2个特征变量。航向标准差、航向方差和停留时间这3个特征变量的重要性排名与基于MDA的排名相同,都为重要性排名最低的特征变量。距离方差和距离标准差的重要性排名优于船舶轨迹最大距离,这与基于MDA的排名不同。
通过2个指标对比可知,与距离有关的特征变量(平均距离、距离方差、距离标准差、距离离散系数、最大距离、与海岸线距离)重要性排序靠前,这是因为船舶在泊位停留时,往往固定在泊位进行装卸操作,其船舶轨迹点间的距离偏差较小,而船舶在锚地停留时,船舶停留位置往往会动态移动(如船舶一端固定),其船舶轨迹点间的距离偏差较大,因此距离特征变量更有利于船舶泊位停留轨迹与船舶锚地停留轨迹的区分。

3.3.3 港口泊位和锚地提取

基于船舶停留轨迹分类模型对研究区内 349 757个船舶停留轨迹进行分类,得到182 819个船舶泊位停留轨迹和166 938个船舶锚地停留轨迹。利用空间相邻逐级合并方法分别提取港口泊位和锚地。以赤湾港(中国深圳港的一个港区)为例,其港口泊位和锚地提取结果如图8所示。分析可知,提取的泊位区域与影像中真实泊位的位置吻合较好。
图8 赤湾港泊位区域和锚地区域提取结果

Fig. 8 Extraction of harbor berth areas and anchorage areas of Chiwan Port

3.4 港口目标识别

基于提出的港口目标识别方法,提取研究区内的港口目标,共提取出447个港口区域。为了验证港口提取结果的完整性,将提取结果与Natural Earth数据集中2017年10 m分辨率的港口点位数据[28]进行对比,对比结果如图9所示。Natural Earth港口点位数据经过去除河港以及人工校验为正确港口点位处理后,得到研究区内24个港口点位(图9)。通过提取港口结果与Natural Earth港口点位对比发现,Natural Earth港口点位数据包含的24个港口都被本文方法准确提取。由于Natural Earth港口点位数据包含的多是大中型港口,因此对于大中型港口而言,本文提出的港口识别方法不存在漏检的情况。IMO规定总吨300以上的船舶才会装备AIS系统,而一些小港口进出的船舶可能没有装备AIS系统,使得它们的活动轨迹不能被AIS系统捕捉到,从而导致所提方法不能提取出该类港口。因此,所提港口识别方法的局限性主要体现在不能提取没有AIS数据覆盖的港口。
图9 提取港口结果与Nature Earth港口点位数据对比

Fig. 9 Comparison of extracted port results with Nature Earth port point data

为了进一步验证提取港口区域的准确性,将提取结果与Google Earth影像进行叠加验证,可以发现,提取的447个港口区域都位于真实的港口影像内,说明所提港口目标识别方法的虚警率极低。提取港口区域实例如图10所示。可以看出,港口区域被准确提取,且具有较准确的港口区域边界。相比于现有基于影像识别港口目标的方法,本文方法得到的港口区域边界更加符合真实场景,且无需制作港口区域边界训练样本。相比于现有港口点位数据,本文方法得到的港口区域粒度更细,本文方法得到的港口区域可以看作是泊位粒度的港口区域。
图10 港口目标识别实例

Fig. 10 Examples of harbor area detection

4 结论与讨论

本研究针对港口目标探测,提出一种不同于遥感影像检测的识别方法。以船舶轨迹数据入手,通过与地理信息数据、水深数据、LUCC数据等多源数据集成,丰富船舶活动的语义信息,构建船舶港口停留轨迹语义模型。基于船舶港口停留轨迹语义模型,识别船舶港口停留轨迹,并分类船舶的泊位停留行为和锚地停留行为,实现对船舶停留行为的感知和挖掘。通过空间相邻逐级合并方法分别提取港口泊位区域和港口锚地区域。最后,基于情景-领域知识,综合多源数据实现港口区域边界的探测。
基于2017年96 790艘船舶的超8300万条AIS轨迹记录,应用本文方法识别南海研究区的港口目标。实验结果表明,本文方法对于船舶轨迹停留行为总体分类精度为0.9477,Kappa系数为0.8948;提取出南海研究区447个港口区域,与Google Earth影像叠加验证结果表明,提取结果均位于真实的港口影像内;通过提取港口结果与Natural Earth港口点位对比发现,Natural Earth港口点位数据包含的24个港口都被本文方法准确提取,且提取结果的完整性大大增强。因此,该方法能够感知船舶停留行为,实现船舶泊位停留与锚地停留的分类,并且能够准确提取港口目标。由于本研究中港口区域的范围是以LUCC数据中的不透水面为基础,因此其边界的准确性受LUCC数据精度的影响。实验中用到的LUCC数据为 10 m分辨率,若改用更高分辨率的LUCC产品,港口区域边界的提取结果将更加准确。此外,由于船舶AIS数据中包含船舶类型信息,因此通过获取不同船舶类型泊位停靠的信息,还可进一步区分泊位的类型,如某一泊位只有油轮停靠,则可推断该泊位为油轮泊位。
基于遥感影像的港口目标识别方法是一种有效且常用的方法,对于大尺度港口目标探测,如何确定港口靶区是提高基于影像探测港口目标方法效率的关键。本研究提取的港口区域可为基于遥感影像的港口目标探测提供靶区,通过将本研究方法与基于遥感影像的目标探测方法相结合,可以更加高效实现大尺度港口目标的动态探测。
[1]
Tu E M, Zhang G H, Rachmawati L, et al. Exploiting AIS data for intelligent maritime navigation: A comprehensive survey from data to methodology[J]. IEEE Transactions on Intelligent Transportation Systems, 2017, 19(5):1559-1582. DOI: 10.1109/TITS.2017.2724551

DOI

[2]
Yan Z J, Xiao Y J, Cheng L, et al. Exploring AIS data for intelligent maritime routes extraction[J]. Applied Ocean Research, 2020, 101:102271. DOI: 10.1016/j.apor.2020.102271

DOI

[3]
陈仁丽, 王宜强, 刘柏静, 等. 基于GIS和AIS的渤海海上船舶活动时空特征分析[J]. 地理科学进展, 2020, 39(7):1172-1181.

DOI

[ Chen R L, Wang Y Q, Liu B J, et al. Spatio-temporal characteristics of ship activities in the Bohai Sea based on GIS and AIS[J]. Progress in Geography, 2020, 39(7):1172-1181. ] DOI: 10.18306/dlkxjz.2020.07.010

DOI

[4]
Yu H C, Murray A T, Fang Z X, et al. Ship path optimization that accounts for geographical traffic characteristics to increase maritime port safety[J]. IEEE Transactions on Intelligent Transportation Systems, 2021, 23(6):5765-5776. DOI: 10.1109/TITS.2021.3057907

DOI

[5]
李长安, 谢宗奎, 吴忠强, 等. 改进灰狼算法及其在港口泊位调度中的应用[J]. 哈尔滨工业大学学报, 2021, 53(1):101-108.

[ Li C A, Xie Z K, Wu Z Q, et al. Improved grey wolf algorithm and its application in port berth scheduling[J]. Journal of Harbin Institute of Technology, 2021, 53(1):101-108. ] DOI: 10.11918/201911117

DOI

[6]
Jia S, Li C L, Xu Z. Managing navigation channel traffic and anchorage area utilization of a container port[J]. Transportation Science, 2019, 53(3):728-745. DOI: 10.1287/trsc.2018.0879

DOI

[7]
常莉莉, 王贤敏, 王春胜. 基于改进Faster R-CNN的码头自动识别[J/OL]. 遥感学报, 2021.

[ Chang L L, Wang X M, Wang C S. Automatic dock identification based on improved Faster R-CNN[J/OL]. Journal of Remote Sensing, 2021. ] DOI: 10.1016/j.isprsjprs.2018.09.014

DOI

[8]
Li Y S, Zhang Y J, Huang X, et al. Deep networks under scene-level supervision for multi-class geospatial object detection from remote sensing images[J]. ISPRS Journal of Photogrammetry and Remote Sensing, 2018, 146:182-196. DOI: 10.1016/j.isprsjprs.2018.09.014

DOI

[9]
王金传, 谭喜成, 王召海, 等. 基于Faster R-CNN深度网络的遥感影像目标识别方法研究[J]. 地球信息科学学报, 2018, 20(10):1500-1508.

DOI

[ Wang J C, Tan X C, Wang Z H, et al. Faster R-CNN deep learning network based object recognition of remote sensing image[J]. Journal of Geo-information Science, 2018, 20(10):1500-1508. ] DOI: 10.12082/dqxxkx.2018.180237

DOI

[10]
Li K, Cheng G, Bu S H, et al. Rotation-insensitive and context-augmented object detection in remote sensing images[J]. IEEE Transactions on Geoscience and Remote Sensing, 2018, 56(4):2337-2348. DOI: 10.1109/TGRS.2017.2778300

DOI

[11]
Zhang S, He G H, Chen H B, et al. Scale adaptive proposal network for object detection in remote sensing images[J]. IEEE Geoscience and Remote Sensing Letters, 2019, 16(6):864-868. DOI: 10.1109/LGRS.2018.2888887

DOI

[12]
Iervolino P, Guida R. A novel ship detector based on the generalized-likelihood ratio test for SAR imagery[J]. IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing, 2017, 10(8):3616-3630. DOI: 10.1109/JSTARS.2017.2692820

DOI

[13]
Renga A, Graziano M D, Moccia A. Segmentation of marine SAR images by sublook analysis and application to sea traffic monitoring[J]. IEEE Transactions on Geoscience and Remote Sensing, 2019, 57(3):1463-1477. DOI: 10.1109/TGRS.2018.2866934

DOI

[14]
Cui Z Y, Li Q, Cao Z J, et al. Dense attention pyramid networks for multi-scale ship detection in SAR images[J]. IEEE Transactions on Geoscience and Remote Sensing, 2019, 57(11):8983-8997. DOI: 10.1109/TGRS.2019.2923988

DOI

[15]
Chang Y L, Anagaw A, Chang L N, et al. Ship detection based on YOLOv2 for SAR imagery[J]. Remote Sensing, 2019, 11(7):786. DOI: 10.3390/rs11070786

DOI

[16]
方志祥, 余红楚, 黄守倩. 海洋运输网络研究进展与趋势探讨[J]. 地球信息科学学报, 2018, 20(5):554-563.

DOI

[ Fang Z Y, Yu H C, Huang S Q. Review of research works on maritime network[J]. Journal of Geo-information Science, 2018, 20(5):554-563. ] DOI: 10.12082/dqxxkx.2018.180178

DOI

[17]
Yan Z X, Chakraborty D, Parent C, et al. Semantic trajectories: Mobility data computation and annotation[J]. ACM Transactions on Intelligent Systems and Technology, 2013, 4(3):1-38. DOI: 10.1145/2483669.2483682

DOI

[18]
Alvares L O, Bogorny V, Kuijpers B, et al. A model for enriching trajectories with semantic geographical information[C]// Proceedings of the 15th annual ACM international symposium on advances in geographic information systems. 2007:1-8. DOI: 10.1145/1341012.1341041

DOI

[19]
Hage W R, Malaisé V, Vries G K D, et al. Abstracting and reasoning over ship trajectories and web data with the Simple Event Model (SEM)[J]. Multimedia Tools and Applications, 2012, 57(1):175-197. DOI: 10.1007/s11042-010-0680-2

DOI

[20]
Chen B, Xu B, Zhu Z, et al. Stable classification with limited sample: Transferring a 30-m resolution sample set collected in 2015 to mapping 10-m resolution global land cover in 2017[J]. Science Bulletin, 2019, 64:370-373. DOI: 10.1016/j.scib.2019.03.002

DOI

[21]
Natural Earth. 10m Coastline v4.0.0[DB/OL]. 2017[2020-10-20]. https://www.naturalearthdata.com/downloads/10m-physical-vectors/10m-coastline/

[22]
Haklay M, Weber P. Openstreetmap: User-generated street maps[J]. IEEE Pervasive Computing, 2008, 7(4):12-18. DOI: 10.1109/MPRV.2008.80

DOI

[23]
GEBCO Compilation Group, GEBCO 2019 Grid[DB/OL]. 2019 [2020-10-25]. https://www.gebco.net/data_and_products/historical_data_sets/#gebco_2019

[24]
Yu L, Gong P. Google Earth as a virtual globe tool for Earth science applications at the global scale: Progress and perspectives[J]. International Journal of Remote Sensing, 2012, 33(12):3966-3986. DOI: 10.1080/01431161.2011.636081

DOI

[25]
Breiman L. Random forests[J]. Machine learning, 2001, 45(1):5-32. DOI: 10.1023/A:1010933404324

DOI

[26]
Kroodsma D A, Mayorga J, Hochberg T, et al. Tracking the global footprint of fisheries[J]. Science, 2018, 359(6378):904-908. DOI: 10.1126/science.aao5646

DOI PMID

[27]
Han H, Guo X L, Yu H. Variable selection using mean decrease accuracy and mean decrease gini based on random forest[C]// 2016 7th IEEE International Conference on Software Engineering and Service Science (ICSESS). IEEE, 2016: 219-224. DOI: 10.1109/ICSESS.2016.7883053

DOI

[28]
Natural Earth. 10m Ports v4.0.0[DB/OL]. 2017[2020-10-20]. https://www.naturalearthdata.com/downloads/10m-cultural-vectors/ports/

Outlines

/