地理大数据时空模式挖掘的方法与应用研究

基于室内定位数据的群体时空行为可视化分析

  • 承达瑜 , 1, 2 ,
  • 秦坤 3 ,
  • 裴韬 , 1, * ,
  • 欧阳 4 ,
  • 王蒙 4 ,
  • 徐连明 4
展开
  • 1. 中国科学院地理科学与资源研究所 资源与环境信息系统国家重点实验室,北京 100101
  • 2. 河北工程大学矿业与测绘工程学院,邯郸 056038
  • 3. 中国矿业大学环境与测绘学院,徐州 221116
  • 4. 北京智慧图科技有限责任公司,北京 100191
*通讯作者:裴 韬(1972-),男,江苏扬州人,博士,研究员,研究方向为空间分析及时空数据挖掘。E-mail:

作者简介:承达瑜(1980-),男,江苏常州人,博士,讲师,主要从事网络地理信息服务、空间定位数据分析与应用、地质体三维建模等研究。E-mail:

收稿日期: 2018-05-29

  要求修回日期: 2018-09-24

  网络出版日期: 2019-01-20

基金资助

国家重点研发计划项目(2017YFB0503602)

资源与环境信息系统国家重点实验室开放基金

教育部人文社科基金项目(18YJCZH257)

国家自然科学基金项目(41525004)

Visual Analysis Design and Implementation for Group Spatiotemporal Behavior based on Indoor Position Data

  • CHENG Dayu , 1, 2 ,
  • QIN Kun 3 ,
  • PEI Tao , 1, * ,
  • OU Yang 4 ,
  • WANG Meng 4 ,
  • XU Lianming 4
Expand
  • 1. State Key Laboratory of Resources and Environmental Information System, Institute of Geographic Sciences and Natural Resources Research, Chinese Academy of Science, Beijing 100101, China
  • 2. School of Mining and Geomatics, Hebei University of Engineering, Handan 056038, China
  • 3. School of Environment Science and Spatial Informatics, China University of Mining and Technology, Xuzhou 221116, China
  • 4. Beijing RTMAP Technology Company Limited, Beijing 100191, China
*Corresponding author: PEI Tao, E-mail:

Received date: 2018-05-29

  Request revised date: 2018-09-24

  Online published: 2019-01-20

Supported by

National Key Research and Development Program of China, No.2017YFB0503602

Grant from State Key Laboratory of Resources and Environmental Information System

The Ministry of education of Humanities and Social Science project, No.18YJCZH257

National Natural Science Foundation of China, No.41525004

Copyright

《地球信息科学学报》编辑部 所有

摘要

室内定位数据记录了用户在室内空间活动的时空轨迹,是研究人群室内行为的重要信息源。室内数据时空耦合、分布复杂,可视化分析可以更好地揭示其规律。然而,与室外数据不同,室内数据具有时空粒度细、定位精度高等特点,与POI之间的空间关系更为明确,其轨迹受到室内设施和空间的制约,出现高维和不规则的特征,而这给室内行为研究提供依据的同时,又给可视化分析带来一定的挑战。现有的可视化方法主要应用于室外定位数据,关注轨迹自身的活动轨迹分析,往往忽略了所经过POI语义信息表达。针对这一问题,首先分析室内空间结构与定位数据的特征,阐述室内空间可视化分析的特殊性;在此基础上,面向室内人群的时空分布、移动模式及相关POI之间的对比、关联分析的需求,细化可视化分析的内容,明确可视化分析与展示的对象,并设计数据结构;从数据结构、可视化方法、展示图件及用户交互4个层次构建时空行为可视化分析模型;基于上述方法,采用WebGIS和WebGL技术综合设计和实现了面向商场定位的商场客流分析系统;最后,通过某一大型商场的用户定位数据进行可视化分析,从而验证了研究成果的正确性和有效性。

本文引用格式

承达瑜 , 秦坤 , 裴韬 , 欧阳 , 王蒙 , 徐连明 . 基于室内定位数据的群体时空行为可视化分析[J]. 地球信息科学学报, 2019 , 21(1) : 36 -45 . DOI: 10.12082/dqxxkx.2019.180248

Abstract

Indoor position data records the Spatiotemporal trajectory of users' activities in indoor space and is an important source of information for studying individual behavior. The similarity with the outdoor positioning data is that the space and time of the data is coupled and distributed, and the visual analysis can better reveal its regularity. However, unlike outdoor positioning data, indoor data has characteristics such as fine granularity in space and time, high positioning accuracy, and a clearer spatial relationship with POI (Point of Interest). Its trajectory is constrained by indoor facilities and space, resulting in high dimensional and irregular characteristics. The visual analysis of these data provides a basis for indoor behavior research, but also brings certain challenges. The existing visualization methods are mainly applied to outdoor positioning data, focusing on the trajectory analysis of spatiotemporal behavior itself, and often neglecting the expression of the POI semantic information with trajectory. To solve this problem, this paper first analyzed the characteristics of indoor location data, in comparison with the particularity of outdoor spatial visualization analysis. On this basis, facing spatial-temporal behavior analysis requirements for the indoor population spatial and temporal distribution, the movement mode and the correlation between related POIs of indoor population, detailed visual analysis contents, cleared the objects for visualize analysis and presentation, and design data structures . And then, this paper constructs a spatiotemporal behavior visualization analysis model from data structure, visualization method, display map and user interaction. Based on the above methods, a passenger flow visualization analysis system was designed for shopping mall with users' Wifi positioning data and implemented by use of the technology of WebGIS (Web based Geographic Information System ) and WebGL (Web Graphics Library). The system realized passenger flow analysis and display in different shops, floors and entire shopping malls in the form of two-dimensional and three-dimensional integration. Finally, correctness and effectiveness of the research results were verified through a practical example.

1 引言

在城市生活中,人类超过80%的时间处在住宅、办公室、商场等室内空间[1,2]。了解和掌握室内人群的活动情况,如人群的分布、密度及轨迹等信息,有助于公共灾害防护、公共设施优化及商业服务等。近年来,随着移动通信、无线定位和GIS技术的发展,获取个体在建筑物内部空间位置数据已取得重要进展,包含Wifi、蓝牙、Zigbee及RFID等多种定位方式,在精度上达到亚米级[3],实现在商场内可精确到商铺柜台位置、在机场内、地铁站等公共空间能得到用户集群的精确位置数据,从而为分析室内个体时空行为注入了新活力。由于室内定位数据时空粒度细、定位精度高,其所反映的主体与兴趣点(Point of Interest,POI)间的空间关系更加明确,使得行为目的性判断更加准确。因此,基于室内定位数据研究个体或群体的时空行为已成为地理信息科学研究的前沿问题[4,5]
与卫星定位、无线移动等室外位置数据类似,室内定位数据也是一种同时具备地理空间位置与时间标签的轨迹大数据,描述了个体空间位置和属性随时间的变化,蕴含丰富的个体行为信息,但要从庞杂的位置数据中挖掘出清晰和结构化的知识也是一项难度很大的工作。其中,如何将室内定位数据细粒度、垂向重叠、随机性强及POI关联的基本特征和时态信息展现出来是一个关键问题。可视化方法可直观地呈现多维时空轨迹的数据特征,并提供丰富的互动,有助于分析人员的理解,为发现轨迹中多维属性之间的关系、探索数据之间的关系提供一个重要的工具和手段,已被广泛应用于基于轨迹数据的人群行为模式、通勤行为、职住空间等时空行为特征分析研究。但是,目前常用轨迹可视化方法[6,7](如专题图、路径可视化及流图等)主要针对室外中、小尺度的GPS、手机信令数据及自然数据(如飓风、台风)的分析与表达。相比较室外空间,室内环境在空间范围、布局、受限条件及拓扑关系上具有很大的差别,如空间范围小、无明显的路网、空间垂向延展,特别是轨迹与POI的关联更紧密,对室内定位数据可视化分析不仅需要表达个体自身的时空特征,同时也要展示相关POI之间关联关系。因此,当前着重展示数据自身特征的室外定位数据可视化方法并不完全适用室内可视化分析,尚不能有效地辅助室内个体时空行为特征的分析。目前也有学者在室内可视化分析方面做了一些研究,如Petrenko等[8]基于学生的室内活动位置数据,结合GIS空间分析和可视化方法,分析学术活动和考试等事件对学生分布热点的影响; Yoshimura等[9,10]根据从卢浮宫获取的游客参观序列数据,分析在最短时间内参观完卢浮宫所有展品的最优路径,并以三维可视化方式进行展示。但是这些研究只是针对个体/人群时空行为中某一特定行为进行可视化表达,没有综合地分析人群在室内的时空行为。
针对上述问题,本文通过分析室内外空间差异,综合现有的可视化分析方法,面向室内个体/人群时空分布、移动模式以及行为习惯及属性推断以及人与室内环境的交互作用分析的视角,设计符合室内可视化分析模型;在此基础上,以城市大型商场室内空间分析为例,采用WebGIS、WebGL和 D3.js图形框架设计与研发商场客流可视化分析系统,从而验证研究的正确性。

2 室内定位数据特征

可视化分析是利用人类视觉认知的高通量特点[11],以图形的形式表现数据信息的内在规律。了解室内定位数据的特点,能更好地将数据的内在特征展现出来。二者的主要特点如表1所示。相比于开放的室外空间而言,室内空间在空间布局、拓扑、环境限制、空间约束等方面更加复杂,主要体现在[12,13,14]:① 空间相对封闭、范围小:室内空间是有限的,围护空间无论大小都是在一个有限范围内;② 空间受限物多、约束性强:室内空间的墙壁、门、走廊、楼层和楼梯等建筑物组件的约束和影响;③ 具有空间垂向性:大多数的室内空间是多层的,在垂直方向延伸;④ 无明显的路网:室内空间虽有走廊、楼梯及电梯等固定通道,但在封闭空间之间的联通比较灵活(如商场商铺之间、室内房间之间等),除了固有的一些主要通道外,没有显著的室内路径;⑤ 空间实体变动性强:室内空间实体主要是人工设施,由于人类的特殊行为、意外的事件或自然因素,导致所包含实体的变动性强。
Tab. 1 Characteristics of indoor space and position data

表1 室内空间及定位数据特点

序号 室内空间特点 定位数据特点
1 空间相对封闭、空间小 数据的密度高、不同个体的位置数据相似度高
2 无明显的路网、空间受限物多、约束性强 随意性强、时空变化快、轨迹更加复杂
3 具有空间垂向性 数据具有垂直重叠性
4 RFID、蓝牙、WIFI及红外定位技术 定位精度高、与POI归属性明确
受室内空间特点的影响,室内定位数据呈现以下特征[15]:① 数据密度高:由于室内空间有限,单位面积所接收的数据量大,而且不同个体的位置数据相似度高;② 随意性强、时空变化速度快,显示的轨迹更加复杂:由于室内空间不像室外有明确的交通路线,活动轨迹完全由人的主观行为而定,其活动方向、速度相比于室外数据的随机性更强,室内定位数据的轨迹更加复杂;③ 数据具有垂直重叠性:由于室内建筑大多是多层、立体结构,使得室内定位数据在垂向上呈现重叠性;④ 与POI归属性明确:室内空间范围小,定位方式与GPS不同,只要接收器放置合适,不会受到封闭空间影响,能够完全采集到POI内部的定位数据,因此,定位数据与POI的归属关系在语义上是明确的,能够很清晰地辨别是否在POI内部或外部。

3 可视化分析设计

3.1 可视化对象与内容

当前对个体/人群的室内时空行为分析[16]主要是通过人群的时空分布、移动模式挖掘人群的活动规律;同时,结合POI的语义信息,进行人流统计、人与POI、POI与POI之间的关联分析,从而推断个体/人群的属性信息,挖掘人群与室内环境之间的交换关系,所涉及的对象主要是个体、人群、POI及其三类对象的组合。因此,室内定位大数据的可视化分析本质上将通过定位数据可视化展示这三者之间的关系,通过将人群位置点的时空分布、个体/人群轨迹、人群的移动模式及统计的信息的可视化展示和交互分析。
其中,时空分布侧重于分析群体在室内的基本分布情况及时空参数的统计特征,以密度图、定位数据动画展示为主;移动模式分析主要挖掘个体或人群在空间移动中的规律,以路径可视化、迁徙图及时空立方体展示为主;统计量分析主要是对定量数据进行统计,以饼图、柱状图、分级图等GIS专题图为展示主体;相关性分析则分析变量之间存在的关联关系,包括轨迹与POI、不同POI之间的相关性。同时,将POI所蕴含的语义信息,如类型、空间位置、面积及其他信息作为上述可视化内容的参数进行组合表达。如在时空分布分析中将POI的类型作为可视化参数设置POI的背景色,直观地反映不同类型POI中人群的时空分布的差异;在移动模式分析中,以POI分类、空间位置等语义信息作为参数,以颜色、形状大小区分,不仅能展示人群在不同POI之间的流动方向、流量和速度,也体现了POI类型、所处空间位置对人群移动的影响,更有利于移动模式的挖掘;在统计量分析中,将POI的语义信息与统计量相结合,进行组合分级图;在相关性分析中,以POI为节点,构建以节点与线组成的“流”空间,以人群流动为传输媒介进行可视化展示,结合流动空间的拓扑结构,分析不同POI之间的关联关系。
从可视化展示形式来看,由于室内空间封闭、多楼层,纵向具有重叠性,因此在可视化表达个体/人群在不同楼层间的流动时,采用三维的形式是首选。由于室内空间无明显的路网,进行空间实体之间关系可视化表达并不能很精细的展示连接关系,而是将他们的连通、次序及拓扑关系表达清楚,即将四维(含时间维度)、三维的数据维度进行降维,映射到二维平面进行展示。此外,从时空行为的时间维度来看,静态的可视化展示表达某一个时刻的行为信息,在某一时间段内的行为变化则以动画展示比较合适。因此,室内可视化内容则需要综合考虑分析类型、室内空间特征和时态变化等不同情况,即在现有的密度图、分级图、迁徙图及立方图的基础上,分别进行组合扩展,具体展示内容如表2所示。
Tab. 2 Visual content

表2 可视化内容

序号 分析类型 展示内容 维度 时态
1 时空分布 密度图、GIS专题图(饼图、柱状图) 二维、三维 静态、动态
2 移动模式分析 轨迹直接可视化、时空立方体、迁徙图 二维、三维 静态、动态
3 相关性分析 迁徙图、轨迹图、桑基图、弦图 二维、三维 静态、动态
4 统计量分析 GIS专题图(唯一、分级渲染) 二维、三维 静态
5 对比分析 GIS专题图(饼图、柱状图)、力引导图、网络图 二维 静态

3.2 数据结构设计

从上述室内空间实体及定位数据的几何特征来看,室内定位数据其基本要素是定位点,定位点的序列则构成用户的时空轨迹,而由不同用户的轨迹构成了用户在室内空间的时空行为,同时与用户相关的POI序列也可以称为广义上的轨迹。基于上述室内空间及定位数据的特征,将用户的一个位置点数据表示为定义1所示的四元组[17],而用户的轨迹则可为定义2所表达的以时间序列组成的点集合。
(1)定义1 室内位置点数据(轨迹点): P tr j = < mac , x , y , f , t > ,其中x,y为平面坐标,f为室内空间楼层(若只有一层,f为一定值),t为该点的时间戳,mac为用户身份标识。
不同于室外定位数据的三元组 P i = < x , y , t > (不含高程)或 P i = < x , y , h , t > 四元组(含高程)表示方式,室内空间具有垂向重叠性,为了避免不同定位点之间叠加,必须有明确的楼层信息。
(2)定义2 用户轨迹: S trj = p 1 , , p i , p j , , p n ,其中pi为每个轨迹点,并且 t p i < t p j , 1 i < j m ,即集合中每个轨迹点是以时间的先后进行组合的。
室内POI点类型多样,既包含有房间、走廊及上下楼层连接通道等以线、面表达的几何形体,也有消防设备、电梯等以点表示的空间实体,可视化表达非常复杂。针对可视化统计、关联在不同尺度下的分析需求,将POI以定义3所示的3元组形式进行表达。
(3)定义3 室内POI点: poi = < id , geometry , f , attribute > ,其中,id为POI的编号,geometry为POI的几何形状并且 geometry point , polygon ,即根据不同的展示需要将POI的形状抽象为点或面表示(如进行统计分析时以面表达,进行关联性分析时则以POI多边形的中心点来表示),f为POI所处的楼层,attribute为POI所代表的空间实体的性质、功能、用途的语义信息。
(4)定义4 用户POI 序列: S poi = po i 1 , , po i i , , po i n , poii为与用户相关的POI信息。由于室内空间无明显的路网信息,并且在分析中,研究人员更多关注的是人群在室内不同兴趣点之间的切换情况,而忽略个体移动过程中的详细轨迹信息,因此将用户的POI序列视为广义的轨迹。
将相似用户轨迹(含用户POI序列)进行聚类,形成轨迹簇,在起点和终点间形成人群流,蕴含着丰富人群的时空行为信息;同时,由于室内垂直延展、数据有垂向重叠性、特别是POI的序列往往不在同一平面、位置上也不相邻。针对这一特点,借鉴流空间“不必地理邻接即可实现共享时间之社会实践的物质组织”的思想[18],定义室内流结构,如定义5所示。以人群流动为基础媒介,结合POI语义信息,可视化不同POI之间的人流,分析室内群体及相关属性(属性、年龄、性别、偏好)的流动,体现这些流动中蕴含的人群时空行为。流要素主要由节点和线要素组成。其中,节点由节点要素、节点类型构成,节点要素为该节点表示的所处位置、统计量及其他信息,节点类型则反映了该节点在网络中的地位,由主要节点和次要节点之分;线要素则是两个端点间关系的直接体现,表达人群流动的量、速度、方向及其他相关信息。
(5)定义5流: flow = id , ptb , pte , t , attribute , symbol , id为流的编号,ptbpte为起点和终点,ptbpte为轨迹点或POI点,attribute为流的属性包含流量、方向、速度等,symbol为流的符号,包含线型、颜色、粗细及箭头等,symbolattribute对应,依据attribute的信息将流的符号量化表示(如根据流量、速度选取线型、设置线的粗细等),流的方向可为单向,也可为双向,具体方向由attribute属性决定。此外,流结构派生于TGIS模型,包含起始时间与持续时间属性。其数据结构如图1所示。
Fig. 1 Flow data structure

图1 “流”可视化对象数据结构

(6)定义6网络:网络Ne是由流变换而来,是一个元组序列, N e = e 1 , , e i , , e n ,其中ei为室内空间的流。

3.3 可视化模型设计

从上述室内空间实体及定位数据的几何特征来看,室内可视化对象还是以点(轨迹点、POI)、线(轨迹、人流)和面(POI、走廊、通道等)为主。在GIS中常用专题信息可视化的方法就是符号化,即根据空间实体的专题要素信息(如统计量)确定几何图形的大小、颜色、图案等,从而实现数据特征的表达。然而室内定位数据、POI等室内空间实体,包含着平面坐标、楼层信息及时间等四个维度信息,其室内可视化需要考虑不同平面、时间的信息,仅仅以符号化的方法已不再适合。因此,本文以面向对象的思想设计一个 G _ obj = ge ometry , symbol , f , t 四元组可视化表达的抽象模型。其中,geometry为空间几何图形,f为垂向(楼层)信息,t为时间戳,symbol为几何对象的符号,其符号化内容与可视化对象的数值描述相对应。通过垂向与时间参数组合,实现室内可视化对象二/三维、静态与动画展示等不同表达方式。基于此抽象模型分别结合室内点、线、面要素特点扩展相关的可视化对象模型,从而实现人群及相关POI之间关联在时空上可视化表达。
在此基础上,本文提出了以分析需求为导向的可视化分析模型。图2为可视化分析流程图,从上到下依次是分析过程所涉及不同要素。用户通过UI层选择分析类型、分析指标,系统根据分析类型及详细参数选择可视化分析的方法,依据可视化对象选择相应的数据结构,生成可视化的图件;同时,用户依据分析需求,通过UI交互修改图件的符号、颜色等相关图形属性,突出所分析数据的属性特征。
Fig. 2 Visual analysis process

图2 可视化分析流程

4 实现与应用

基于上述可视化模型的理论研究,结合某大型商场Wifi定位数据,针对商场客流管理与灾害预防的需求,采用WebGIS、WebGL技术及d3.js数据可视化包进行商场客流分析系统设计与实现,并对可视化展示的有效性进行分析。

4.1 系统设计与实现

商场客流分析系统针对商场Wifi定位产生的大量位置数据,采用室内可视化对象模型及可视化分析的方法,结合查询、统计功能,直观、多维度的展示位置数据中蕴含的商场用户(单个用户和用户群体)时空行为,挖掘用户和用户群体的购物行为以及与之关联的客流变化、不同商铺的关联关系,为商场公共安全、优化资源配置提供良好决策支持。系统包括6个模块,即数据管理、地图操作、查询和统计、客流分析、可视化展示和报表管理,各模块功能如图3所示。数据管理模块是对客户数据和室内地图的管理,实现客户数据导入、导出以及二、三维室内地图的生成、更新;其中,客户数据是指客户的定位数据。地图操作实现二、三维地图常规的浏览、图层的显示/隐藏、空间查询和量测等功能。报表管理则是实现查询、统计信息的报表生成,也可以根据用户的需求,依据客流信息和客流类型进行分类、分时的生成报表,并打印输出。系统中查询和统计、客流分析和可视化展示功能模块是系统核心功能,三者相互关联,相互调用。查询和统计功能以商场、楼层、商铺不同的层次进行客流量分析统计,并提供与Hadoop大数据平台的交互接口,实时读取大数据平台中的定位数据;客流分析结合可视化展示功能,为不同的室内客流的分析提供地图专题图、迁徙图、密度图、力引导图等一系列可视化地图,将查询和统计信息进行可视化分析与展示。
Fig. 3 System function diagram

图3 商场客流分析系统功能

基于上述功能设计,采用B/S架构,将WebGIS、WebGL与开源JavaScript图表库相结合,研发商场客流可视化分析系统。首先将商场不同楼层的平面图(SHP格式)符号化,构建室内地图文档,采用Arcgis Server发布为地图服务;同时又将楼层平面图构建为Geojson格式,采用Three.js生成在线的三维场景,通过楼层编号与商铺编号实现二图地图与三维场景的关联。采用Ext.js、Arcgis server api与d3.js等javascript框架开发各类可视化分析功能,从而实现商场客流的可视化分析。

4.2 实例分析

本文从商场空间展示、行为模式、时空分布及关联分析4个方面阐述可视化分析的应用,从而验证研究成果的有效性(图4)。
Fig. 4 Market indoor space display

图4 商场室内空间展示

(1)商场空间展示
商场空间的可视化是进行分析的基础,系统提供了二维地图和三维立体展示的2种方式,并实现了二、三维联动,更直观、全面的展示了商场的室内空间。图4(a)以二维的方式展示了某一个楼层的平面图,有利于楼层的精细分析;图4(b)则以三维方式展示了多个楼层,便于立体、全面的了解楼层分布信息。
(2)行为模式分析
轨迹展示是人在室内移动模式分析的重要内容,反映了个体在室内空间活动时的心理或者环境制约,通过轨迹可视化表达可挖掘出人活动规律。系统设计开发了二维展示与三维展示的方法,如图5所示。图5(a)为平面轨迹展示,通过该平面展示可以分析出,该用户没有进邻近的商铺,而是去了一个相对距离比较远的商铺,表面购物目的性很明确;图5(b)为三维轨迹展示,能立体、直观地展示用户跨楼层的行为,看出闲逛型的用户一般优先访问靠近楼梯的商铺,故可分析出商铺所处空间位置是影响其营业额的一个因素。由于室内没有明显的路径,在进行轨迹展示前,需要进行室内路径构建。本文参考已有研究成果[19],构建了室内路径,因篇幅有限,不展开阐述。
Fig 5 Visual Analysis of User Trajectory Display

图5 用户轨迹可视化分析

(3)群体时空分布分析
商场客流变化是室内时空分布分析的体现,通过室内定位数据对人群在室内分布进行动态反演,有助于科学认识人群在室内活动的总体特征。系统提供了2种商场客流变化的可视化展示方法: ①定位数据直接可视化展示,即按时间序列,将人群位置信息在地图中展示,以动画的形式反映客流变化情况(图6(a)、(b)中每个点为一个顾客);②做密度分析,以热度图的方式进行可视化(图6(c)、(d)),通过不同时间段热度图的展示反演客流变化情况。从图6(a)、(b)可知,从开始营业到中午时段,人群不断增加,直观地展示了人群由于对特定空间区域的偏好或受热点事件吸引而表现出的空间集聚现象;图6(c)、(d),反映了在12时和晚上19时客流密度相差不大,都属于商场高峰期。
Fig. 6 Visual analysis of passenger flow

图6 客流变化可视化分析

(4)关联分析
商铺间关联分析主要展示某一商铺与其他商铺之间的关联,即该商铺顾客的流入与流出情况,挖掘出人群的流动规律,有助于认识人群活动规律,推断出购物行为与习惯。系统采用迁徙图和力引导图的方式进行可视化的展示,如图7所示。其中,迁徙图(图7(a))以流的方式展示了客流在不同商铺之间的流动,图中分别以颜色、粗细表达客流量的级别,同时2个商铺之间以小图标的移动表示客流的方向,并随着时间的变化而变化。力引导图(图7(b))也是以流方式展示不同商铺之间的关联,实心圆是某一商铺的中心点,周边的圆表达与之关联的商铺(圆的大小由流动的客流量决定),图7(b)是一个分等级导向流拓扑结构,通过每个节点的大小,可以分析出人群流动中每个POI的吸引力,进而分析出该类人群偏好信息。这2种关联展示都是定量分析,不仅能展示图形,也能统计出客流量的流动。二者不同之处在于迁徙图适合同一楼层的商铺展示,而力引导图适用于不同楼层商铺关联展示。
Fig. 7 Visual analysis of shop relationship

图7 商铺关联可视化分析

室内空间客流分析经常需要考虑跨楼层的情况,采用三维可视化展示是最合适的方式;而对于一些不用了解具体空间位置,只需了解相关联名字信息时,可通过映射方式,将三维的信息投影到二维平面中,系统中开发了弦图和桑基图的可视化展示方式,展示结果如图7(c)、(d)所示。弦图直观地展示了人群在不同商铺之间流动情况,如光顾 “Levis”的顾客大多会去“Lee”,而很少会去鲜元素,进而反应了人群的移动模式;而图7(d)所示的桑基图则表达了光顾“Apple”经销商店的顾客会去哪些商铺的情况,从而分析出这些商铺间的相关性。

5 结论

针对室内定位数据进行用户行为可视化分析展示研究。通过分析分析室内外空间及相关定位数据的特征,结合当前室内用户时空行为、移动模式、关联分析及对比分析所涉及的空间对象,明确室内可视化的要素,并完成了形式化描述;以点、线、面、流和网络进一步构建了室内空间要素的可视化模型;在此基础上,面向大型商场Wifi定位数据,设计和开发了商场客流分析系统,通过商场客流变化、商铺间客流分析、用户轨迹展示及非空间化分析等应用,验证研究的正确性和有效性。
本文完成了室内空间的二、三维展示,初步实现了动、静结合的多维度室内用户行为可视化分析,但在跨楼层的三维迁徙图、热度图及客流变化等方面还有待完善。

The authors have declared that no competing interests exist.

[1]
Klepeis N E, Nelson W C, et al.The National Human Activity Pattern Survey (NHAPS): A resource for assessing exposure to environmental pollutants[J]. Journal of Exposure Analysis & Environmental Epidemiology, 2001,11:231-252.U.S. Environmental Protection Agency. Because human activities impact the timing, location, and degree of pollutant exposure, they play a key role in explaining exposure variation. This fact has motivated the collection of activity pattern data for their specific use in exposure assessments. The largest of these recent efforts is the National Human Activity Pattern Survey (NHAPS), a 2-year probability-based telephone survey (n=9386) of exposure-related human activities in the United States (U.S.) sponsored by the U.S. Environmental Protection Agency (EPA). The primary purpose of NHAPS was to provide comprehensive and current exposure information over broad geographical and temporal scales, particularly for use in probabilistic population exposure models. NHAPS was conducted on a virtually daily basis from late September 1992 through September 1994 by the University of Maryland's Survey Research Center using a computer-assisted telephone interview instrument (CATI) to collect 24-h retrospective diaries and answers to a number of personal and exposure-related questions from each respondent. The resulting diary records contain beginning and ending times for each distinct combination of location and activity occurring on the diary day (i.e., each microenvironment). Between 340 and 1713 respondents of all ages were interviewed in each of the 10 EPA regions across the 48 contiguous states. Interviews were completed in 63% of the households contacted. NHAPS respondents reported spending an average of 87% of their time in enclosed buildings and about 6% of their time in enclosed vehicles. These proportions are fairly constant across the various regions of the U.S. and Canada and for the California population between the late 1980s, when the California Air Resources Board (CARB) sponsored a state-wide activity pattern study, and the mid-1990s, when NHAPS was conducted. However, the number of people exposed to environmental tobacco smoke (ETS) in California seems to have decreased over the same time period, where exposure is determined by the reported time spent with a smoker. In both California and the entire nation, the most time spent exposed to ETS was reported to take place in residential locations.

DOI PMID

[2]
周成虎. 全空间地理信息系统展望[J].地理科学进展,2015,34(2):129-131.地理信息系统作为一门空间科学,以其独特的空间观点和空间思维,从空间相互联系和相互作用出发,揭示各种事物与现象的空间分布特征和动态变化规律。本文从地理信息系统所研究的空间对象出发,对地理信息系统发展新方向提出思考:①从地球空间拓展到宇宙空间,需要构建宇心坐标系和宇宙GIS、月球GIS等;②从室外空间延伸到室内空间,需要发展室内GIS,并拓展到水下空间和地下空间;③从宏观到微观空间,可以发展面向游戏的体育GIS、面向生命健康管理的人体GIS等;④面向大数据时代,发展大数据空间解析的理论和方法,贡献于大数据科学的发展。

DOI

[ Zhou C H.Prospects on pan-spatial information system[J]. Progress in Geography, 2015,34(2):129-131. ]

[3]
邓中亮,张森杰,焦继超,等.基于高精度室内位置感知的大数据研究与应用[J].计算机应用,2016,36(2):295-300.随着室内定位技术的发展,室内位置数据和用户消费行为数据的大量产生为室内位置大数据(LBD)研究和应用提供了可能。基于高精度室内位置感知,突破了室内定位位置数据不准确的瓶颈。通过对室内位置数据聚类、降维等预处理,建立挖掘模型分析并提取了室内商圈区域的聚散和流动等特性,进一步通过特征关联预测用户的消费等行为,提出了室内位置大数据协同挖掘的方法和架构。在某机场商圈、西单某商场亿级用户位置数据集上进行了有效性实验和应用,通过实测数据对比验证了基于此架构室内定位数据的精准性和挖掘方法的可行性。

DOI

[ Deng Z L, Zhang S J, Jiao J C, et al.Research and application of high-precision indoor location-aware big data[J]. Journal of Computer Applications, 2016,36(2):295-300. ]

[4]
Delafontaine M, Versichele M, Neutens T, et al.Analysing spatiotemporal sequences in Bluetooth tracking data[J]. Applied Geography, 2012,34:659-668.The use of Bluetooth technology as a technique to collect data about the movement of individuals is increasingly gaining attention. This paper explores the potential of sequence alignment methods to analyse data obtained from Bluetooth tracking. To this end, an empirical case study is elaborated which applies sequence alignment methods to examine the behavioural patterns of visitors tracked by Bluetooth at a major trade fair in Belgium. The results and findings underline the validity of Bluetooth tracking to collect data from visitors at mass events, as well as the ability of sequence alignment methods to extract insightful information from sequences within such data.

DOI

[5]
刘瑜,康朝贵,王法辉.大数据驱动的人类移动模式和模型研究[J].武汉大学学报·信息科学版,2014,39(6):660-666.大数据时代的到来使得基于个体粒度的海量时空轨迹获取人类移动模式成为可能。来自不同领域的学者基于手机通话数据、公交卡刷卡记录、社交网站签到数据、出租车轨迹、银行刷卡记录等进行了人类移动模式的研究,这些研究丰富了地理信息系统的时空分析方法,为从个体角度审视人与地理环境之间的交互关系提供了一个新视角,并可以应用于交通、公共卫生等领域。总结了基于大数据的人类移动模式研究流程,归纳了人类移动模式的基本度量方法,探讨了解释所观测移动模式的模型构建方法,指出了地理环境对于移动模型建立的影响。

DOI

[ Liu Y, Kang C G, Wang F H.Towards big data-driven human mobility patterns and models[J]. Geomatics and Information Science of Wuhan University, 2014,39(6):660-666. ]

[6]
王祖超,袁晓如.轨迹数据可视分析研究[J].计算机辅助设计与图形学学报,2015,27(1):9-25.轨迹数据大量产生于交通、气象、生态和移动服务等领域.有效地理解和利用这些数据不仅需要自动高效的分析方法,也需要直观生动的可视化;这两者相互结合形成了可视分析技术.文中概述了轨迹数据可视分析中的主要方法和交互技术,并介绍了一系列应用案例.最后,文中总结了轨迹数据可视分析研究中的问题和面临的挑战.

DOI

[ Wang Z C, Yuan X R.Visual analysis of trajectory data[J]. Journal of Computer-Aided Design & Computer Graphics, 2015,27(1):9-25. ]

[7]
蒲剑苏,屈华民,倪明选.移动轨迹数据的可视化[J].计算机辅助设计与图形学学报, 2012,24(10):1273-1282.GPS,RFID和无线通信设备的爆炸状发展,让人们有可能搜集到大量的车辆、人群等的移动轨迹数据(简称轨迹数据),这些数据在交通管理、流动性分析、路线推荐等很多领域有着重要的应用.轨迹数据同时包含空间和时间属性,数据量大且维度高,分析起来难度很大.可视化技术可以直观地呈现多维时空轨迹数据,并提供丰富的互动,以揭示数据中包含的时空规律.文中总结了轨迹数据的可视化技术的研究现状,介绍了多个应用案例.

DOI

[ Pu J S, Qu H M, Ni M X. Survey on visualization of trajectory data[J]. Journal of Computer-Aided Design & Computer Graphics, 2012,24(10):1273-1282. ]

[8]
Petrenko A, Sizo A, Qian W, et al.Exploring mobility indoors: An application of sensor-based and GIS systems[J]. Transactions in GIS, 2014,18(3):351-369.AbstractThe popularization of tracking devices, such as GPS, accelerometers and smartphones, have made it possible to detect, record, and analyze new patterns of human movement and behavior. However, employing GPS alone for indoor localization is not always possible due to the system's inability to determine location inside buildings or in places of signal occlusion. In this context, the application of local wireless networks for determining position is a promising alternative solution, although they still suffer from a number of limitations due to energy and IT-resources. Our research outlines the potential for employing indoor wireless network positioning and sensor-based systems to improve the collection of tracking data indoors. By applying various methods of GIScience we developed a methodology that can be applicable for diverse human indoor mobility analysis. To show the advantage of the proposed method, we present the result of an experiment that included mobility analysis of 37 participants. We tracked their movements on a university campus over the course of 41 days and demonstrated that their movement behavior can be successfully studied with our proposed method.

DOI

[9]
Yoshimura Y, Sobolevsky S Y, Ratti C, et al.An analysis of visitors' behavior in the Louvre Museum: A study using Bluetooth data[J]. Environment and Planning B: Planning and Design, 2014,41(6):1113-1131.

DOI

[10]
Yoshimura Y, Sobolevsky S Y, Girardin F, et al.New tools for studying visitor behaviours in museums: A case study at the Louvre[C]. Proceedings of the international conference on information and communication technologies in tourism, 2012.

[11]
陈为,沈则潜,陶煜波.数据可视化[M].北京:电子工业出版社,2013:11-23.

[ Chen W, Shen Z Q, Tao Y B.Data visualization[M]. Beijing: Publishing House of Electronics Industry, 2013:11-13. ]

[12]
金培权,汪娜,张晓翔,等.面向室内空间的移动对象数据管理[J].计算机学报,2015,38(9):1777-1795.调查表明:人们有87%左右的时间都在室内空间中活动,例如办公 楼、商场、地铁站等。随着物联网以及RFID、Wi-Fi 等室内定位技术的快速发展,如何有效管理日益增长的室内移动对象数据,使其支持多样化的室内位置服务应用,已成为公共安全、商业服务等诸多领域都亟需解决 的基础性共性问题。本文针对室内空间在空间约束、定位技术、距离度量等方面的特点,归纳了室内空间移动对象数据管理研究中的关键问题,指出了移动对象数据 管理研究领域的主要进展,讨论了室内空间表示模型、室内移动对象位置与轨迹模型、室内空间查询处理和室内移动对象索引等关键技术。在此基础上,对室内移动 对象数据库的研究前景进行了展望。

DOI

[ Jin P Q, Wang N, Zhang X X, et al.Moving object data management for indoor spaces[J]. Chinese Journal of Computer, 2015,38(9):1777-1795. ]

[13]
汪娜. 面向室内空间的时空数据管理[D].合肥:中国科学技术大学,2014:11-13.

[ Wang N.Research on key techniques of spatio-temportal data management for indoor space[D]. Hefei: University of Science and Technology of China, 2014:11-13. ]

[14]
应申,朱利平,李霖,等.基于室内空间特征的室内地图表达[J].导航定位学报,2015,3(4):74-78,91.当前室内地图的研究主要侧重于定位、导航等位置服务,却很少关注其自身的建模和表达。而室内地图是室内位置服务的信息载体和计算基础,其建模与表达会在很大程度上影响地图信息的传输。目前的室内地图大多从建筑设计的角度出发,仅表示出建筑要素,其传达出的信息相对于复杂的室内空间是十分有限的,并且由于其缺乏空间认知的支持以及适当的地图要素表达方式,会给用图者带来困难和误解。本文从空间认知的角度,以人们对空间定位、边界的首要需求出发,将室内环境中的空间分为封闭空间、半封闭空间以及开放空间,并特别关注空间边界的半高情形。据此进行室内要素的建模选择与表达,使室内地图更符合我们人类的空间认知,并且可以满足室内地图的导航、应用等需求。

DOI

[ Ying S, Zhu L P, Li L, et al.Representation of indoor maps with the analysis of indoor space[J]. Journal of Navigation and Positioning, 2015,3(4):74-78,91. ]

[15]
Kim J, Kang H, Lee T, et al.Topology of the Prism Model for 3D indoor spatial objects[C]. Taipei: Tenth international conference on mobile data management: Systems, Services and Middleware, 2009:698-703.

[16]
舒华,宋辞,裴韬.室内定位数据分析与应用研究进展[J].地理科学进展,2016,35(5):580-588.现代人文地理学的研究越来越多地关注人的时空行为,而获取个体在出行活动中的时空位置数据是研究人类时空行为的前提。受数据获取技术的限制,之前对时空行为的研究主要集中在室外空间。随着室内定位技术的出现和应用,这类研究由室外空间扩展至室内空间。室内定位技术和方法较多,但从数据的角度来看,根据数据获取中使用定位方法的不同,可将室内定位数据分为几何位置数据、指纹位置数据和符号位置数据3类。目前,基于室内定位数据的研究可以归结为以下4个方面,即:人在室内的时空分布、人在室内的移动模式、人在室内的行为习惯及属性推断、人与室内环境的交互作用。然而,总体上目前的研究还处于探索阶段,理论和方法体系尚未成熟。本文认为后续的研究中需要关注以下问题:1数据获取方面。相对于蓝牙、射频识别、红外等定位技术,"智能手机+Wi Fi"模式的定位系统具有覆盖范围广、成本低廉、无需专门设备支持、易与用户交互等优势,是一种最具应用前景的室内定位技术;2研究内容方面。时空行为特征的研究是基础,个体属性推断及个体与环境的相互作用形式和机理研究将是重点,多时空尺度数据融合分析是一种趋势;3科学伦理方面。室内定位涉及微观尺度人类活动的记录,隐私保护问题需要高度关注。

DOI

[ Shu H, Song C, Pei T.Progress of studies on indoor positioning data analysis and application[J]. Progress in Geography, 2016,35(5):580-588. ]

[17]
王倩. 室内移动对象轨迹相似性度量与应用[D].合肥:中国科学技术大学,2015:15-17.

[ Wang Q.Similarity measurement and application of indoor moving-object trajectories[D]. Heifei: University of Science and Technology of China, 2015:15-17. ]

[18]
Castells M.An introduction to the information age[J]. City, 1997,2(7):6-16.

[19]
王行风,汪云甲.一种顾及拓扑关系的室内三维模型组织和调度方法[J].武汉大学学报·信息科学版,2017,42(1):35-42.针对室内空间三维导航、几何模型高质量渲染的需求与个人移动平台资源、计算能力有限之间的矛盾,在分析室内空间区域功能、明确室内单元类型的基础上,构建了能够表达室内空间各部分拓扑特征,且支持三维路径分析的室内空间网络拓扑关系模型,并在准确把握室内空间区域拓扑逻辑关系的前提下,探讨了顾及室内拓扑关系的空间分割和几何模型的组织和调度策略,以实现室内模型的动态遮断和剔除.实验结果表明,利用所提方法可以实现几何模型的实时遮断和剪裁,大幅度减少模型绘制的数量和数据量,提升数据传输和绘制的效率,为高逼真度的三维模型可视化绘制奠定了数据基础和保证.

DOI

[ Wang X F, Wang Y J.Organization and scheduling of indoor three-dimensional geometric model based on spatial topological relation[J]. Geomatics and Information Science of Wuhan University, 2017,42(1):35-42. ]

文章导航

/