中文地址分词是中文地址标准化的基础工作和地理编码的重要手段,同时也是中文分词和地理研究领域中关注的热点问题之一。针对当前中文地址分词方法缺乏地址层级切分和过多依赖词典和特征的问题,本研究结合四词位标注集和中文层级地址特点,构建针对中文层级地址分词的地址标注体系,并提出融合双向长短时记忆网络和条件随机场(BiLSTM-CRF)的中文层级地址分词模型。该模型既考虑了BiLSTM模型能够记忆上下文地址的特性,也保留了CRF算法可以通过转移概率矩阵控制地址标注输出的能力。针对该地址标注体系标注的训练地址样本,分别使用CRF、LSTM、BiLSTM与BiLSTM-CRF模型进行训练对比。结果表明:① 基于中文地址标注体系的模型分词效果更佳,地址标注更为精细,符合实际地址分布情况;② BiLSTM-CRF模型精确度达到93.4%,高于CRF(90.4%)、LSTM(89.3%)和BiLSTM(91.2%),其整体地址分词性能和各层级地址分词效果相对于其他模型更突出;③ 各模型分词性能与地址层级保持一致,即地址层级越高,分词效果越好。本研究提出的中文地址标注体系和分词模型为开展中文地址标准化工作提供了方法参考,同时也为进一步提升地理编码技术的精准度提供了可能。
“一带一路”沿线为自然灾害高发地区,且多为经济欠发达、抗灾能力弱的发展中国家。灾害发生时,挖掘和分析相关推特数据有助于开展应急救援、灾情评估、减灾防灾等工作,为中国国际救援与救助工作提供重要支撑。主题模型能在没有经验语料库的情况下,从海量灾害相关推文中快速聚合出对灾害救援、评估有价值的信息。本文采用BTM模型和LDA模型,对2013年海燕台风相关推文进行细粒度的主题聚类,分析2个模型的精度并测试它们对近似灾害主题的区分能力,并基于“需求相关”主题类的推文,通过地名匹配,分析了海燕台风发生过程中菲律宾物资、医疗等需求程度的空间分布。结果表明: ① 在区分主题近似的短文本时,BTM总体精度为0.598,LDA的总体精度仅为0.321,说明在海燕台风灾害推文的主题识别中,BTM模型的精度高于LDA模型;② BTM能够较好识别出“灾害地点相关”、“祈福相关”等较为精细的灾害主题;③ 经初步验证,基于“需求相关”主题文本生成的物资、医疗等需求的需求程度空间分布与实际需求情况基本相符。
三维地质空间表达可以准确揭示地质现象与过程的空间结构与分布规律。传统三维地质建模方法广泛存在着面向局部小区域、基于投影数据、表面静态建模、难以进行3D空间查询与分析、不利于时空大数据的组织与管理等缺陷。地球剖分网格以其全球全方位视角、循环递归剖分机制和有机灵活的编解码策略为解决上述问题、构建新一代数字地球平台提供了新的技术方案。本文以郑州航空港经济区为例,利用实测地质数据,基于球体测地线八叉树剖分瓦块(SGOG网格),建立区域真三维地质模型框架,并进行空间分析。在对原始数据进行预处理的基础上,将SGOG特定剖分层次的瓦块节点与地质体外包络体特征点数据进行匹配,构建真三维地质框架;通过漏洞修补和着色渲染,建立多尺度多地层三维地质体模型;在此基础上,进行真三维地质空间分析,包括地质体真三维剖面、数字钻孔以及几何特征参数计算。实验结果表明:本文的建模方法,不但结构简单,操作方便,适用于复杂不规则的地质体,而且可以利用SGOG瓦块的多尺度特性,灵活实现精度与尺度的自适应表达,方便进行多角度真三维空间分析。地球剖分网格是数字地球发展的必然趋势。
在室内应急疏散的背景下,理解人们如何感知应急疏散标识以及他们的感知如何影响疏散行为十分重要。虚拟地理环境基于虚拟现实(VR)技术构建的沉浸式多维信息空间,是一个符合人类感知认知规律的三维、动态、可交互空间。而基于虚拟地理环境的虚拟地理感知/认知实验,则可以提供一个可定量观测的可控虚拟实验环境,通过设计多种实验方案,定量地获取与空间感知、认知行为相关的客观实验数据。本文将沉浸式虚拟环境与眼动追踪技术相结合,设计了VR眼动感知实验,以室内通道为例,采用定量观测、数据统计、可视化分析等方法,对不同虚拟火灾逃生场景下的疏散时间、眼动注视点、个体移动轨迹数据进行了处理与分析,最后对室内应急疏散标识布局进行评估并提出合理建议。实验结果表明:① 女性参与者比男性更容易被逃生起始位置干扰,拥有较差的虚拟空间感;② 3种场景类型(无标识无烟雾、有标识无烟雾、有标识有烟雾)在疏散时间之间存在明显差异,应急标识、烟雾与逃生起始位置对疏散时间有显著性影响;③ 通道墙贴标识的感知率最高为0.929,在火灾逃生中最容易被识别;④ 安全出口标识感知率最低为0.333,眼动注视点大多在安全门而非安全出口标识上,因此需要提升安全出口标识的视觉吸引力;⑤ 室内通道微观环境的不同(例如通道长度)对应急标识注视时长的变化有较大影响;⑥ 安全出口附近的标识布局、设计有待改进。虚拟眼动感知实验为评估室内应急疏散标识的合理性和布局优化提供了一个有效的科学途径。
道路的修建往往带来景观破碎、生态系统功能受损等后果。有关道路网络的生态影响格局及其影响因素,是当前道路生态学、地理空间分析等领域共同关注的问题。本文利用2015年全国道路网络数据,采用定量空间分析方法,刻画了当前中国铺装道路所引起的陆表景观破碎的格局特征,并分析了道路网络对自然保护区的干扰及与多变量的影响关系。结果表明:① 全国铺装道路的生态影响面积占陆地面积的10%,将陆表切割成3万多个斑块,并呈现小斑块数目众多,大斑块数目较少的分布特点;同时,陆表破碎化程度呈现明显的东西分异规律,空间格局与人口分布、经济发展水平等影响因素的地理分布规律趋同;② 全国约58%的自然保护区受到道路干扰,保护区的受干扰情况存在高等级保护区受干扰弱、低等级保护区次之、国家公园受干扰程度最强等差异特征,且国家公园处于受干扰高于未设保护区域的状态;③ 主要人类活动因素与保护区受干扰程度呈正相关,保护区面积、地形因素与受干扰程度呈负相关,具有面积小、受保护等级低、位于平原地区、气候适宜等特征的保护区更易受到道路干扰,处于已经受到人类活动破坏,生态脆弱的状态。因此,中国道路建设应追求社会发展与生态保护双平衡,同时道路干扰受到自然以及人文要素的共同作用,在相关影响机制研究和生态保护政策制定中应进行综合考虑。
研究青藏高原城镇化格局的时空分异及其影响因素,有利于推动青藏高原现代人类活动时空过程的认知,对青藏高原就地就近城镇化及可持续发展具有参考意义。根据历次人口普查数据,本研究构建青藏高原县市尺度城镇化空间数据集,参考城镇化发展阶段,采用LISA空间类型划分法和空间计量回归模型,系统分析1990-2010年青藏高原内部城镇化格局的时空分异特征及影响因素。主要结论包括:① 青藏高原整体城镇化水平偏低,2017年底,青藏高原主体部分青海省和西藏自治区的常住人口城镇化水平分别为53.07%和30.8%,低于全国同期水平的58.52%,但青藏高原内不乏高水平城镇化地区,而且各地区间城镇化水平的空间差异缩小;② 青海西部柴达木盆地是高水平城镇化集聚区,羌塘地区是低水平城镇化集聚区,地级行政中心所在县市多呈现自身高、周边低的城镇化格局;③ 与内地相似,第二、三产业从业机会是推动青藏高原城镇化发展重要因素,社会公共服务资源对城镇化拉动作用开始凸显。研究结果可以为青藏高原人类活动研究和青藏高原就地就近城镇化可持续发展政策提供参考。
青藏高原作为中国重要的生态环境保护地,城镇化和生态环境的变化受到广泛关注。本文基于1990-2015年土地利用数据,进行生态用地和城乡建设用地之间的转移分析,通过核密度以及标准差椭圆分析进行空间转移强度的定性研究。结果表明:① 1990-2015年青藏高原生态用地显著地向城乡建设用地转移,是城乡建设用地向生态用地转移量的54.6倍,其中2000-2005年和2010-2015年是用地转移的热点时期;② 城乡建设用地与生态用地之间的转换在空间上呈现逆向状态,生态用地向城乡建设用地的转移分布逐渐从青藏高原的周边区域向腹地蔓延;城乡建设用地向生态用地的转移最初出现在青藏高原的腹地,逐渐向外围扩张;③ 生态服务功能越大的生态用地,越容易被人类占用,随之发生用地类型的转移,侵占后的土地很难反向转移为具有高生态服务功能的生态用地。
降水作为气候系统的关键因素,也是影响区域植被生长以及生态变化规律的重要因子。本文针对黑河流域气象站点分布稀疏情况,采用信息熵及半变异函数理论构建该流域虚拟气象站点,并结合部分已有站点对整个流域降水进行插值模拟。信息熵可以计算每个站点降水值所包含的信息,通过联合熵以及条件熵来依次选取所含信息量多的站点,同时结合半变异函数模型来观察各站点之间的空间相关性,以此构建最优站点数据集。利用1991-2003年该流域15个气象台站的年平均降水量作为基础数据,考虑高程、坡度、坡向对降水的影响,对降水进行相关性分析,建立回归方程反演虚拟站点降水值。最后,采用协同克里金(Co-Kriging)与具有漂移的克里金(KED)方法对该流域进行插值,对比插值精度。结果表明,增加虚拟站点有效提高了降水插值精度,在该情况下使用KED方法插值结果与观测值最接近。
喀斯特山地流域植被变化具有独特性,探究其植被变化特征有利于石漠化治理和退耕还林工程科学实施。本文选取1990-2016年贵州石阡河流域Landsat系列遥感影像,采用像元二分模型和相关分析等方法研究流域植被覆盖度时空变化特征,并探究其变化的地形效应和人口效应。研究表明:① 1990-2016年贵州石阡河流域植被覆盖度总体处于上升趋势,植被恢复取得较好效果;② 1990-2016年贵州石阡河流域植被覆盖度变化的地形效应中,随海拔和坡度上升,植被覆盖度总体处于稳定上升趋势。随坡向变化中,无坡向地区植被覆盖度最低,其他坡向差异不明显;③ 1990-2016年贵州石阡河流域植被覆盖度变化的人口效应中,随人口密度上升,植被覆盖度总体处于下降趋势。研究结果可以为喀斯特地区退耕还林还草和石漠化治理提供科学依据。
随着信息技术的发展,电子商务的盛行推动着快递行业的迅猛发展,快递自提点成为人们日常生活的重要场所,从而成为城市地理与物流地理的重要研究对象。本文基于2018年4月深圳市菜鸟驿站和中国邮政速递物流站点的POI数据,综合运用文本分析、数理统计、空间分析方法,解析深圳市快递自提点的空间分布特征和影响因素。研究发现:① 快递自提点依托类型多样:由市场主导的菜鸟驿站主要依托专业的快递公司、便利店等;由政府主导的邮政站点一般设于中国邮政的分支服务网点;② 快递自提点服务对象种类繁多,二者都主要以服务社区为主,企业、工业园、酒店等为辅;③ 快递自提点的区位选择一般靠近服务对象的出入口,80%的快递自提点分布在距其最近出入口200 m范围内,邮政站点更接近服务对象;④ 快递自提点的空间分布不均衡,呈现“中西部多,东部少”的特点,沿“东-西”走向集聚分布,为多核集聚模式;⑤ 快递自提点的空间格局是区域经济发展水平、人口分布、交通便捷程度、土地利用类型等多因素综合作用的结果,最后探索了快递自提点选址与分布的综合影响机制。
两江新区作为中国第一个内陆开放区,在短时间内经历了高强度开发,其社会经济空间结构演变对于国家新区的发展和规划具有重要意义。两江新区的城市建设用地扩张基本分布在中心城区外围,部分沿交通线向外扩张,并可通过元胞自动机模型对未来建设用地演变趋势进行模拟。本研究基于两江新区的人口数据、建设用地空间分布、道路数据等基本要素分析区域空间结构演变过程,定性与定量相结合研究两江新区空间结构演变的特征与机制并进行多模型模拟。研究结果表明:① 从人口、用地、交通等基本要素的时空变化可以看出,两江新区自2010年6月成立至2015年,区域城镇中心体系和空间结构都发生了明显的变化;② 政策环境、基础设施、要素成本和集聚效应是企业入驻两江新区的4个主要驱动因素;③ 两江新区建设用地扩张空间累积阻力值呈同心圆和轴带发展形态,建设用地空间演变基本向空间累积阻力值低的方向和地区扩张;④ 元胞自动机模型模拟的结果精度在80%以上,能够展示过去5年两江新区空间结构的演变过程和未来该区域空间结构的状况。本研究的结果能够为内陆开放区的优化建设提供科学参考,有助于提高重庆市两江新区开发建设的效益。
遥感影像空间分辨率的不断提高,一方面为使用者提供了更加丰富的地物信息,另一方面却也加大了信息准确高效提取的难度。影像分割是遥感影像目标提取的关键步骤,影像分割的效果直接影响信息提取的精度和准度。面对众多分割算法,影像分割效果评价成为遥感信息提取和目标识别研究的重点之一。面向典型目标识别问题,本文针对遥感影像监督分割评价问题,从实验的角度讨论其中具有代表性的面积匹配指数、相似尺寸指标、相关区域指标、质量合格率、欧氏距离指标1、欧氏距离指标2、面积差异指数和距离指标的实际性能与适用情况。首先,通过一系列实验测算不同分割方法下的影像与参考影像的差异情况,讨论测算结果并评估差异指标的优缺点;然后,通过对比分析与加权计算,提出了遥感影像监督分割综合评价方法,实验表明该方法在一定程度上有助于分割方法的科学选择以及影像信息提取效率的提高;最后,从评价指标与分割方法2个角度系统分析了实验结果,并指出了影像监督分割评价存在的问题以及发展趋势。
中国西北半干旱区降水稀少、蒸散强烈,土壤水分作为重要的生态因子,影响着土壤-大气界面的能量平衡。支持向量回归模型具有估算精度高、可处理非线性问题、泛化能力强等优点,近年来被应用于土壤水分反演研究中,但已有模型极少考虑地表粗糙度因素的影响,导致反演精度受到一定限制。因此,本文以内蒙古乌审旗为研究区,采用水云模型去除地表稀疏植被覆盖的影响,提取全极化Radarsat-2 SAR影像裸土后向散射系数(
遥感数据因其全覆盖的优势被广泛应用于山地植被信息的调查和研究。为了实现山区植被类型的高精度提取,本文以太白山区为实验区,结合山地植被的垂直地带性分布规律,利用太白山植被垂直带谱、高分辨率遥感影像(GF1/GF2/ZY3)和1:1万的数字表面模型(Digital Surface Model, DSM)数据,进行了多层次、多尺度的影像分割,构建了具有植被垂直带谱信息的地形约束因子,并据此进行样本选择和面向对象的分类,分类总精度达92.9%,kappa系数达到0.9160。该方法相比于未辅以垂直带谱信息的分类,总精度提高了10%。研究结果表明,分类过程中加入具有垂直带谱信息的地形约束因子,能显著地提高样本选择的效率和准确率,为后续的植被分类提供了精度的保证。通过人机交互的方式,将垂直带谱知识应用到分类中,可以有效地提高山地植被分类的精度。
目前对岩溶湿地的重视程度远低于其他湿地类型,缺乏利用遥感技术进行岩溶湿地植被高精度识别的研究,但岩溶湿地同其他湿地类型一样,湿地面积退化严重,亟待需要解决。因此,本文选取受人类活动影响较大、湿地退化较为严重的广西桂林会仙喀斯特国家湿地公园的部分核心区域作为研究区,以DJI大疆御Mavic Pro无人机航摄影像为数据源,利用泛化能力强、分类精度高的面向对象随机森林算法实现了会仙岩溶湿地植被的高精度分类,探究无人机可见光影像和面向对象随机森林算法在岩溶湿地植被识别中的适用性,为无人机遥感技术应用于岩溶湿地的研究和保护提供技术参考。首先,在eCognition Developer9.0中利用多尺度迭代分割算法对影像图层进行分割;然后,基于以往在进行面向对象分类研究的经验来指导我们进行特征选择,充分考虑了影像的光谱和纹理特征、植被指数、无人机遥感数据派生的研究区数字地表模型(DSM)和几何特征;最后,在RStudio中实现了随机森林算法参数的调优、模型的构建以及分类。结果显示,面向对象随机森林算法对会仙湿地植被具有较高的识别能力,在95%置信区间内总体精度为86.75%,Kappa系数为0.83。在单一典型岩溶湿地植被识别精度中,狗牙根-白茅-水龙植被群丛的用户精度在90%以上,生产者精度高于80%,竹子-马甲子-桂花生产者精度高于80%,但是用户精度较低,仅为70.59%。