遥感科学与应用技术

POI辅助下的高分辨率遥感影像城市建筑物功能分类研究

  • 曲畅 , 1, 2 ,
  • 任玉环 1 ,
  • 刘亚岚 , 1, * ,
  • 李娅 1, 2
展开
  • 1. 中国科学院遥感与数字地球研究所,北京 100101
  • 2. 中国科学院大学,北京 100101
*通讯作者: 刘亚岚(1968-),女,博士,研究员,主要从事遥感图像解译与应用研究。E-mail:

作者简介:曲 畅(1991-),女,山东烟台人,硕士生,主要从事遥感图像分类,城市遥感信息提取方法及其应用的研究。E-mail:

收稿日期: 2017-03-20

  要求修回日期: 2017-04-17

  网络出版日期: 2017-06-20

基金资助

高分辨率对地观测系统重大专项(03-Y20A04-9001-15/16)

国家自然科学基金项目(41601387)

Functional Classification of Urban Buildings in High Resolution Remote Sensing Images through POI-assisted Analysis

  • QU Chang , 1, 2 ,
  • REN Yuhuan 1 ,
  • LIU Yalan , 1, * ,
  • LI Ya 1, 2
Expand
  • 1. Institute of Remote Sensing and Digital Earth,Chinese Academy of Sciences, Beijing 100101, China
  • 2. University of Chinese Academy of Sciences, Beijing 100101, China
*Corresponding author: LIU Yalan, E-mail:

Received date: 2017-03-20

  Request revised date: 2017-04-17

  Online published: 2017-06-20

Copyright

《地球信息科学学报》编辑部 所有

摘要

城市建筑物是城市的重要组成部分,对城市建筑物进行功能分类可以为城市功能区划分提供有利依据,辅助政府部门对城市规划、土地利用、资源、人口等方面的分布与分配进行管理与决策,有助于推进城镇化建设的可持续发展。仅利用目前的遥感分类技术难以对高分辨率遥感影像的城市建筑物信息进行功能分类,然而将遥感、互联网兴趣点(Point of Interest, POI)数据以及GIS技术有效地结合在一起,可以更为细致地分析城市信息,不仅实现了建筑物功能分类,而且提高了分类的准确率与可信度。本文首先选取卷积神经网络(Convolutional Neural Networks, CNN)方法对高分辨率遥感影像数据进行建筑物提取;然后,对POI数据的城市商服、公建和住宅用地进行核密度分析;最后分别统计每个建筑物3种用地的核密度平均值,并将该值设置为此建筑物的属性值,并结合POI数据的实际情况选择具有最佳功能分类精度的属性值作为阈值提取3种用地信息,从而完成不同功能的城市建筑物分类。精度评价结果表明,该方法对3种用地的提取效果良好,分类精度达到86%以上。

本文引用格式

曲畅 , 任玉环 , 刘亚岚 , 李娅 . POI辅助下的高分辨率遥感影像城市建筑物功能分类研究[J]. 地球信息科学学报, 2017 , 19(6) : 831 -837 . DOI: 10.3724/SP.J.1047.2017.00831

Abstract

As the space for human habitation and activity, urban buildings are an important part of the city. Their renewal and renovation affects development of the city and changes people’s life at all times. Functional classification of urban buildings provides supporting evidence for categorizing urban functional areas, and also helps the government in land use planning, as well as managing the distribution of population and resources, promoting the sustainable development of urban areas. However, current classification technology of remote sensing is insufficient to make functional classification of urban buildings. In this paper, we analyzed urban information in great depth, by classifying the function of urban buildings. The efficiency and precision of the classification is improved after combining remote sensing, the Internet POI (Point of Interest) data and GIS technology. We first chose the method of CNN (Convolutional Neural Networks) to extract building information from remote sensing images of high resolution. The precision of the extraction is above 93% as is shown by precision evaluation. POI data was then classified into 3 types by manual work, namely buildings used for commercial service, public service and residence. The classified POI data were estimated by Kernel Density. After which the mean Kernel Density value of every type of buildings was calculated and these three types of buildings were delimited by thresholds. Thus, buildings for commercial service, public service and residence could be recognized from the building information assisted by POI data, achieving the functional classification of urban buildings. This method has shown good extraction efficiency compared to visual interpretation-the overall accuracy is 86.85% and Kappa Coefficient is 0.8153 according to precision evaluation. In future research, this method can be used to classify and identify different types of urban buildings. However, there are still some problems to be discussed in this method. For example, when defining buildings’ functional types by threshold of Kernel Density, one building may have more than one or no type. Besides, POI data have some limitations when representing the range of different types of buildings: one point may represent either a grand shopping mall or a convenience store. These will be addressed in future studies.

1 引言

城市建筑物是城市的重要组成部分,作为人类居住与活动的稳定空间,其改造与更新时刻影响着城市的发展与人类生活的变化。按照建筑物的使用功能可将建筑物划分为商业服务业设施用地(商服用地)、公共管理与公共服务用地(公建用地)、住宅用地和工矿仓储用地等类型。对城市建筑物进行功能分类可以为城市功能区划分提供有利的依据,辅助政府部门对城市规划、土地利用、资源、人口等方面的分布与分配进行管理与决策,有助于推进城镇化建设的可持续发展。目前,互联网数据的井喷式涌现及人工智能方法的不断发展,为城市建筑物功能分类提供了有效的数据和方法支撑,城市建筑物功能分类必将成为研究和解决城市相关问题的趋势所在。
随着城市的发展和科学技术的进步,国内外学者对城市功能区划分的研究越来越深入。近几年城市道路和建筑物的功能分类研究受到了关注[1-2],对道路功能分类的理论及应用研究已相对成熟[1],然而对建筑物功能分类的研究才刚刚起步。孙文华等[2]采用时间利用活动分析法,结合现有国内对建筑功能分类的标准,提出较为基础的建筑功能分类体系。Li等[3]根据高分辨率遥感影像所提取建筑物的空间密度大小以及现有的城市土地利用/覆盖数据,运用贝叶斯网络法对城市建筑物进行功能分类,分类提取结果良好。由此可见,城市建筑物功能分类正在从分类标准的定义探讨[2]向结合多源数据对其功能分类的实际应用发展。利用高分辨率遥感影像提取城市建筑物信息能够快速得到建筑物的分布情况,帮助解决城镇化的相关问题。但是仅靠目前的遥感自动分类提取技术难以对城市建筑物进行功能分类识别,提取的结果往往只是单个的图斑,缺少具有语义的属性信息,难以满足城市规划与管理的需求。而人工目视解译的方法虽然可以在一定程度上满足这一需求,精度也较高,但费时费力[4]
POI数据是一个可以被人利用或令人感兴趣的特定点,可应用于多个领域,在地学领域可指某个酒店或者加油站等兴趣点信息。获取POI数据的方法有很多,比较常见的是通过互联网抓取技术来获得兴趣点的名称、类别、经度纬度、附近的酒店饭店商铺等信息。对POI数据进行合理应用会在政府公共服务、零售业、医疗服务业、制造业及涉及个人位置服务等领域带来可观的价值,在一定程度上提高了地理信息的整体服务水平。近年来,不少国内外学者利用POI数据展开一系列的研究与应用,推动了GIS、计算机等多个领域的发展与应用。赵卫峰 等[5]利用城市POI数据提取分层地标。周垠等[6]基于空间句法和POI信息,分析成都市龙泉驿区不同类型商业网点集聚街道与路网空间可达性的关系,为后期商业网点布局提供参考。Chuang等[7]通过搜集抓取互联网上的POI信息,建立POI搜索服务平台,提出了一种优于维基百科的地理信息搜索模型。池娇等[8]利用城市地区的实体建筑物POI数据识别城市单一及混合功能区。
针对目前城市建筑物功能自动分类识别存在的问题,本文提出了一种综合应用互联网POI数据与高分辨率遥感影像,将遥感信息提取技术与GIS空间分析技术相结合的方法来实现城市建筑物的功能分类,从而解决利用遥感信息提取技术难以实现建筑物功能分类识别的难题,并拓展互联网多源数据的应用领域。

2 研究区与数据源

本文研究区为北京市朝阳区安贞门与惠新西街南口附近区域。
研究数据包含2类:① 2.44 m分辨率的QuickBird多光谱卫星影像,获取时间2014年9月26日,已经过几何校正、大气校正等预处理,图1为真彩色合成图;② POI数据,获取时间2014年9月,通过抓取互联网数据获得(图2)。
Fig. 1 QuickBird multispectral images of the study area

图1 研究区域QuickBird卫星多光谱影像

Fig. 2 POI data of the study area

图2 实验区POI信息

抓取到的原始POI数据共有23种类型:政府机构、火车站地铁站、汽车站、公交车站、加油加气站、停车场、高速服务区、金融服务、商业大厦、零售行业、宾馆酒店、休闲娱乐、医疗服务、科研教育、公司企业、公园广场、住宅小区、综合信息、餐饮服务、汽车服务、风景名胜、电讯服务和公共厕所。每种类型的数据中分别包含汉字名称、拼音、地理坐标、电话、地址等信息。
原始POI数据的类型较多,为了便于应用,研究中对POI数据进行归类,具体可以分为商服用地、公建用地和住宅用地,其POI信息在研究区域高分辨率遥感影像上的分布情况如图2所示。
(1)商服用地,即商业、金融业、餐饮旅馆业及其他经营性服务业建筑及其相应附属设施用地。根据《土地利用现状分类标准(GB/T 21010-2007)》(表1[9],本研究将原始POI数据中的加油加气站、金融服务、商业大厦、零售行业、宾馆酒店、休闲娱乐、公司企业、综合信息、餐饮服务、汽车服务和电讯服务这11种类型定义为商服用地。
Tab. 1 Classification standard of land use

表1 土地利用现状分类标准

一级类 二级类 含义
商服用地 批发零售用地 商品批发、零售用地。包括商场、商店、超市、各类批发(零售)市场,加油站等及其附属的小型仓库、车间、工场等
商务金融用地 提供住宿、餐饮服务的用地。包括宾馆、酒店、饭店、旅馆、招待所、度假村、餐厅、酒吧等
住宿餐饮用地 企业、服务业等办公区域,以及经营性的办公场所区。包括写字楼、商业性办公场所、金融活动场所和企业厂区外独立的办公场所等
其他商服用地 上述区以外的其他商业、服务业用地。包括洗车场、洗染店、废旧物资回收站、维修网点、照相馆、理发美容店、洗浴场所等
公建用地 机关团体用地 党政机关、社会团体、群众自治组织等的用地
新闻出版用地 广播电台、电视台、电影厂、报社、杂志社、通讯社、出版社等的用地
科教用地 各类教育,独立的科研、勘测、设计、技术推广、科普等的用地
医卫慈善用地 医疗保健、卫生防疫、急救康复、医检药检、福利救助等的用地
文体娱乐用地 各类文化、体育、娱乐及公共广场等的用地
公共设施用地 城乡基础设施的用地。包括给排水、供电、供热、供气、邮政、电信、消防、环卫、公用设施维修等用地
公园与绿地 城镇、村庄内部的公园、动物园、植物园、街心花园和用于休憩及美化环境的绿化用地
风景名胜设施用地 风景名胜(包括名胜古迹、旅游景点、革命遗址等)景点及管理机构的建筑用地。景区内的其他用地按现状归入相应地类
住宅用地 城镇住宅用地 城镇用于居住的各类房屋用地及其附属设施用地。包括普通住宅、公寓、别墅等用地
农村宅基地 农村用于生活居住的宅基地
(2)公建用地,又可称为公共管理与公共服务用地,是指用于机关团体、新闻出版、科教文卫、风景名胜、公共设施等的土地。本研究将原始POI数据中的政府机构、火车站地铁站、汽车站、停车场、医疗服务、科研教育、公园广场、风景名胜和公共厕所这9种类型定义为公建用地。
(3)住宅用地,指用于建造居民居住用房屋所占用的土地,可分为城镇住宅用地以及农村宅基地。由于本研究只涉及城市建筑物,本文提到的住宅用地特指城镇住宅用地,在原始POI数据中将住宅小区定义为住宅用地。

3 研究方法

本研究首先对POI数据进行核密度分析,从而获取较为直观的不同功能用地的POI空间分布情况,再对高分辨率遥感影像采用卷积神经网络(Convolutional Neural Networks, CNN)进行城市建筑物的提取。在此基础上,统计每个建筑物每种用地的平均核密度值,并以此作为其属性值,通过对属性值设置阈值,完成城市建筑物功能分类。技术路线如图3所示。
Fig. 3 Technology roadmap

图3 技术路线

3.1 核密度分析

本研究对POI点要素进行核密度分析。核密度估计(Kernel density estimation)是一种用于估计未知概率密度函数的非参数检验方法[10-11],由Rosenblatt和Emanuel Parzen提出,又称为Parzen窗(Parzen window)。
假设x1, x2,…, xn为独立同分布Fn个样本点,核密度估计可以从分布密度函数f与其对应的累积分布函数F的关系推导得到[12]
f ( x ) = dF ( x ) dx F x + h - F ( x - h ) 2 h (1)
用经验分布函数Fn(x)= 1 n I xix)估计Fx),代入式(1)后可得:
f ( x ) = 1 nh i = 1 n K ( xi - x h ) (2)
式中:K为核函数(非负,积分为1,符合概率密度性质,并且均值为0),h>0为一个平滑参数,称作带宽(bandwidth)或窗口。各种核函数(如uniform、triangular、biweight、triweight、normal、Epanechnikov)的图形如图4所示。
Fig. 4 Shapes of different kernel functions

图4 几种核函数的图形

其中,Epanechnikov内核在均方误差意义下是最优,效率损失最小的[13]。因此,本研究采用Epanechnikov为核函数对点要素的核密度进行计算,其公式为:
K ( x ) = 3 π - 1 1 - x T x ) 2 , x T x < 1 0 , 其他 (3)

3.2 基于CNN的遥感影像建筑物提取

高分辨率遥感影像的分类是一个复杂的过程,采用浅层结构模型,如支持向量机(Support Vector Machine,SVM)等对其分类有很大的局限性,更深层次的结构模型因其复杂的多层非线性变换而具有更强的表达与建模能力,更适合高分辨率遥感影像的分类提取[14]。而面向对象的方法虽然不容易产生椒盐现象,但也由于实验区结构较为复杂,对分割尺度与分类条件的把握较难。深度学习通过建立类似于人脑的分层模型结构,对输入数据逐级提取从底层到高层的特征,从而很好地建立从底层信号到高层语义的映射关系[15]。而在深度学习的一系列方法中,卷积神经网络(CNN)的特征监测层通过训练数据来进行学习,避免了显式的特征提取,而且同一特征映射面上的神经元权值相同,网络可以并行学习。因此采用CNN方法提取高分辨率影像的建筑物。
CNN的基本结构一般包括输入层、卷积层、下采样层(也被称作池化层)、全连接层及输出层(图5)。其中,卷积层、下采样层(也被称作池化层)、全连接层可统称为隐含层。CNN方法将图像的一小部分作为层级结构的最底层的输入,信息依次传输到不同的层,每层通过一个数字滤波器获得前一层数据的最显著特征。通过对目标的多层学习形成新的识别模型,利用建立的模型对输入影像进行识别。
Fig. 5 The principle of CNN

图5 卷积神经网络原理示意图

3.3 POI信息辅助下的城市建筑物功能分类

得到商服用地、公建用地与住宅用地的核密度图以及城市建筑物提取结果后,再分别统计每个建筑物的3种用地的核密度平均值,使每个建筑物分别有一个商服用地、公建用地与住宅用地的核密度值,并将该值设置为此建筑物的属性值。然后,分别对不同的目标用地设置不同的属性值作为阈值,结合POI数据的实际情况选择具有最佳分类精度的属性值,目标用地属性值大于等于设定阈值的建筑物定义为商服用地、公建用地或住宅用地,从而对商服用地、公建用地与住宅用地进行分类提取,实现城市建筑物不同功能的分类。

4 结果与分析

4.1 POI核密度分析结果

采用Epanechnikov为核函数对POI的核密度进行计算,经过多次实验选择合适的窗口大小,计算每个输出栅格像元周围的点要素的密度。概念上,每个POI点上方均覆盖着一个平滑曲面。在点所在位置处表面值最高,随着与点的距离的增大表面值逐渐减小,在与点的距离等于搜索半径的位置处表面值为零,使用圆形邻域。曲面与下方的平面所围成的空间的体积默认等于1。每个输出栅格像元的密度均为叠加在栅格像元中心的所有核表面的值之和。利用该方法可得到目标POI点(图2)的核密度图(图6)。本文中的核密度表示在单位为1的经纬度网格中所有点密度的叠加值,其中经纬度用十进制经纬度表示。
Fig. 6 Kernel density of the target points

图6 目标点核密度图

4.2 基于CNN的遥感影像建筑物提取

根据QuickBird影像实验区,选择典型的、像元纯度较高的样本80个,建立建筑物样本库。对实验区的样本库使用CNN方法进行训练学习,经反复实验以及相关分类参数的多次调整。发现使用活化函数为对数函数,训练贡献阈值为0.7,训练速度为0.2,隐藏层数为2,训练迭代次数为1000次时建立的模型进行提取,实验能够得到具有最高分类精度的结果。利用该模型,将实验区的建筑物信息识别提出,再剔除其中面积过小的图斑,得到建筑物提取结果(图7)。将提取结果与目视解译结果对比,其精度高达93%。
Fig. 7 Building extraction images

图7 建筑物提取结果

4.3 POI信息辅助下的城市建筑物功能分类

经多次实验发现,当商服用地属性值为11 000 000,公建用地属性值为1 800 000以及住宅用地属性值为1 300 000时,城市建筑物功能分类达到最佳效果。但由于POI数据在表示不同类型用地的范围大小上有一定的局限性,如一个POI点既能表示一个大型购物中心,也能表示某居民楼下的一个小型便利店,因此存在部分建筑物难以划分的情况。因此,分类时需说明的是,可能存在3种用地的属性值均大于或小于阈值的情况,考虑到公建或住宅用地会存在少量商服用地的情况(如居民楼下有便利店),本文将建筑物的类别优先定义为住宅用地和公建用地,具体分类标准如表2所示。
Tab. 2 Functional classification standard of urban buildings

表2 城市建筑物功能分类标准

取值范围 类别名称
商服用地
属性值
公建用地
属性值
住宅用地
属性值
>11 000 000 >1 800 000 >1 300 000 住宅用地
>11 000 000 >1 800 000 <1 300 000 公建用地
>11 000 000 <1 800 000 <1 300 000 商服用地
>11 000 000 <1 800 000 >1 300 000 住宅用地
<11 000 000 >1 800 000 >1 300 000 住宅用地
<11 000 000 <1 800 000 >1 300 000 住宅用地
<11 000 000 >1 800 000 <1 300 000 公建用地
<11 000 000 <1 800 000 <1 300 000 未分类或其他用地
依据表2所示的分类标准进行分类后,将分类结果与目视解译结果进行对比和精度评价,其总分类精度达到86.85%,Kappa系数为0.8153(图8)。
Fig. 8 Functional classification results of urban buildings

图8 城市建筑物功能分类结果

5 结语

本文将遥感、互联网POI数据以及GIS技术有效地结合在一起,更为细致地分析了城市信息,实现了城市建筑物功能分类,提高了分类识别的准确率与可信度,有助于对城市功能区进行精准划分。今后,可利用本文的方法体系实现城市建筑物不同类型用地的分类识别研究。
然而,由于目前遥感信息提取技术还难以实现对高分辨率影像建筑物的精准完整提取,仍然存在有些建筑物错提、漏提或提取不完整的情况,而且在定义建筑物功能类型时可能会遇到一个建筑物有多种类型或无类型的情况。此外,POI数据在表示不同类型用地的范围大小上有一定的局限性,因此难以通过POI数据来判断不同类型用地的范围大小。基于上述原因,在今后建筑物功能划分的研究中可引入更多种类的数据进行分析,如手机通话、出租车轨迹、公交卡刷卡记录、社交网站签到记录等数据。

The authors have declared that no competing interests exist.

[1]
祝江力. 城市道路管理功能分类机理探讨[D].成都:西南交通大学,2008.

[ Zhu J L.Study on urban road management functional classification mechanisms[D]. Chengdu: Southwest Jiaotong University, 2008. ]

[2]
孙文华,陈建国.基于时间利用活动分析的建筑功能分类[J].住宅科技,2016,36(1):5-9.目前,国内各省市统计年鉴中没有统一的建筑功能分类标准并缺少相关数据。随着国内居住建筑供过于求,传统工业建筑因为产业结构调整而需要被转变用途,建筑功能与城市空间之间的关系等研究极需大量相关的建筑功能统计数据。采用时间利用活动分析的方法,结合现有国内对建筑功能分类的标准,提出了较为基础的建筑功能分类体系,并以上海为例,通过相应建筑功能的地理分布来证实城市空间与建筑功能之间的对应关系。

[ Sun W H, Chen J G.Time utilization activity based classification of architectural functions[J]. Housing Science, 2016,36(1):5-9. ]

[3]
Li M M, Alfred S, Wietske B, et al.Urban land use extraction from very high resolution remote sensing imagery using a Bayesian network[J]. Isprs Journal of Photogrammetry & Remote Sensing, 2016,122:192-205.Urban land use extraction from Very High Resolution (VHR) remote sensing images is important in many applications. This study explores a novel way to characterize the spatial arrangement of land cover features, and to integrate it with commonly used land use indicators. Characterization is done based upon building objects, taking their functional properties into account. We categorize the objects to a set of building types according to their geometrical, morphological, and contextual attributes. The spatial arrangement is characterized by quantifying the distribution of building types within a land use unit. Moreover, a set of existing land use indicators primarily based upon the coverage ratio and density of land cover features is investigated. A Bayesian network integrates the spatial arrangement and land use indicators, by which the urban land use is inferred. We applied urban land use extraction to a Pl iades VHR image over the city of Wuhan, China. Our results showed that integrating the spatial arrangement significantly improved the accuracy of urban land use extraction as compared with using land use indicators alone. Moreover, the Bayesian network method produced results comparable to other commonly used classifiers. We concluded that the proposed characterization of spatial arrangement and Bayesian network integration was effective for urban land use extraction from VHR images.

DOI

[4]
严岩. 高空间分辨率遥感影像建筑物提取研究综述[J].数字技术与应用,2012(7):75-76.

[ Yan Y.A survey of high spatial resolution remote sensing image building extraction[J]. Digital Technology and Application, 2012(7):75-76. ]

[5]
赵卫锋,李清泉,李必军.利用城市POI数据提取分层地标[J].遥感学报,2011,15(5):973-988.为了获取能够用于智能化路径引导的层次性空间知识,提出了一种依据显著度的差异从城市POI数据中提取出分层地标的方法。首先,通过从公众认知、空间分布和个体特征3个方面分析影响POI显著性的因素,构造了包括公众认知度、城市中心度和特征属性值3个指标向量的POI显著性度量模型;然后,分别讨论了利用问卷调查、多密度空间聚类和数据规格化的方法计算POI对象的各项显著性指标值的过程;最后,选择武汉市武昌地区的POI数据进行显著度计算,从中提取显著度较高的对象构成若干层地标,并以各层地标为种子生成加权的Voronoi图,用来反映各地标的空间影响范围并建立了同层和上下层地标之间蕴含的关系。

DOI

[ Zhao W F, Li Q Q, Li B J.Extracting hierarchical landmarks from urban POI data[J]. Journal of Remote Sensing, 2011,15(5):973-988. ]

[6]
周垠,张诚,崔铭,等.基于空间句法和POI信息的城市商业网点布局研究——以成都市龙泉驿区为例[J].四川建筑,2014(6):15-18.首先运用空间句法的原理,计算出龙泉驿区路网的形态变量,依此可分析出路网的空间可达性。然后运用大数据的思想,从网上提取购物、餐饮、生活服务类POI信息,反映出这些类型商业网点的空间集聚规律。最后分析不同类型商业网点集聚的街道与路网空间可达性的关系,从而为后期商业网点布局提供参考。

DOI

[ Zhou Y, Zhang C, Cui M.et al.Study on the layout of urban commercial network based on spatial syntax and POI information: An example in Longquan, Chengdu[J]. Sichuan Architecture, 2014,6:15-18. ]

[7]
Chuang H M, Chang C H, Kao T Y, et al.Enabling maps/location searches on mobile devices: Constructing a POI database via focused crawling and information extraction[J]. International Journal of Geographical Information Science, 2016,30(7):1405-1425.With the popularity of mobile devices and smartphones, we have witnessed rapid growth in mobile applications and services, especially in location-based services (LBS). According to a mobile marketing survey, maps/location searches are among the most utilized services on smartphones. Points of interest (POIs), such as stores, shops, gas stations, parking lots, and bus stops, are particularly important for maps/location searches. Existing map services such as Google Maps and Wikimapia are constructed manually either professionally or with crowd sourcing. However, manual annotation is costly and limited in current POI search services. With the abundance of information on the Web, many store POIs can be extracted from the Web. In this paper, we focus on automatically constructing a POI database to enable store POI map searches. We propose techniques that are required to construct a POI database, including focused crawling, information extraction, and information retrieval techniques. We first crawl Yellow Page web sites to obtain vocabularies of store names. These vocabularies are then investigated with search engines to obtain sentences containing these store names from search snippets in order to train a store name recognition model. To extract POIs scattered across the Web, we propose a query-based crawler to find address-bearing pages that might be used to extract addresses and store names. We crawled 1.25 million distinct POI pairs scattered across the Web and implemented a POI search service via Apache Lucent’s search platform, called Solr. The experimental results demonstrate that the proposed geographical information retrieval model outperforms Wikimapia and a commercial app called ‘What’s the Number?’

DOI

[8]
池娇,焦利民,董婷,等.基于POI数据的城市功能区定量识别及其可视化[J].测绘地理信息,2016,41(2):68-73.

[ Chi J, Jiao L M, Dong T, et al.Quantitative identification and visualization of urban functional area based on POI data[J]. Journal of Geomatics, 2016,41(2):68-73. ]

[9]
GB/T 21010-2007,《土地利用现状分类》.

[ China’s National Standard (GB/T21010-2007). Current land use condition classification (in Chinese).]

[10]
Walters R M.Density estimation for statistics and data analysis[J]. Chapman and Hall, 1986,39(4):296-297.

DOI

[11]
Wand M P, Jones M C.Kernel smoothing[M]. London, Chapman & Hall/CRC,1995.

[12]
刘远龙. 核密度估计中的窗宽选择方法[D].合肥:中国科学技术大学,2013.

[ Liu Y L.Bandwidth selection methods in kernel density estimation[D]. Hefei: University of Science and Technology of China, 2013. ]

[13]
Epanechnikov V A. non-parametric estimation of a multivariate probability density[J]. Theory of Probability & Its Applications, 1969,14(1):153-158.The effects of systematic reflections on stacking fault contrast has been studied from the symmetry position to the reflection 3g in the Bragg condition. Optimum contrast in the bright field was obtained when the reflection g was close to the Bragg condition. When the crystal was tilted away from this orientation a marked decrease in contrast occurred with the familiar result that stacking faults become more difficult to observe. Stacking faults in dark field images, on the other hand, exbihited good contrast and were thus relatively easy to observe over the entire range of orientations studied. An explanation for the difference between bright and dark field is given in terms of the important Bloch waves excited at different orientations of the crystal.

DOI

[14]
曹林林,李海涛,韩颜顺,等.卷积神经网络在高分遥感影像分类中的应用[J].测绘科学,2016,41(9):170-175.

[ Cao L L, Li H T, Han Y S, et al.Application of convolutional neural network in classification of high resolution remote sensing imagery[J]. Science of Surveying and Mapping, 2016,41(9):170-175. ]

[15]
Erhan D, Courville A, Bengio Y.Understanding representations learned in deep architectures[J]. IEEE transactions on image processing: A publication of the IEEE Signal Processing Society, 2016,25(8):3762-3774.Deep architectures have demonstrated state-of-the-art performance in a variety of settings, especially with vision datasets. Deep learning algorithms are based on learning several levels of representation of the input. Beyond test-set performance, there is a need for qualitative comparisons of the solutions learned by various deep architectures, focused on those learned representations. One of the goals of our research is to improve tools for finding good qualitative interpretations of high level features learned by such models. We also seek to gain insight into the invariances learned by deep networks. To this end, we contrast and compare several techniques for finding such interpretations. We applied our techniques on Stacked Denoising Auto-Encoders and Deep Belief Networks, trained on several vision datasets. We show that consistent filter-like interpretation is possible and simple to accomplish at the unit level. The tools developed make it possible to analyze deep models in more depth and accomplish the tracing of invariance manifolds for each of the hidden units. We hope that such techniques will allow researchers in deep architectures to understand more of how and why deep architectures work.

文章导航

/