“数据共享与数据挖掘” 栏目所有文章列表

(按年度、期号倒序)

  • 一年内发表的文章
  • 两年内
  • 三年内
  • 全部

Please wait a minute...
  • 全选
    |
  • 数据共享与数据挖掘
    杨雅萍, 姜侯, 孙九林
    地球信息科学学报. 2020, 22(6): 1358-1369. https://doi.org/10.12082/dqxxkx.2020.200110

    地球系统科学是一门综合性交叉学科,起源于全球变化研究,受益于遥感技术进步,现已进入大数据时代,人工智能技术成为解决地球系统科学前沿问题的新手段。科学数据共享是推动科学发展、提升数据价值的关键,经过长期的探索和实践,全球已形成完善的数据资源管理政策与机制、持续的数据共享服务体系、多元化的科学数据整合模式,并且新的理念不断推动数据共享创新发展,其中“可发现、可访问、可互操作和可重用”原则和数据出版备受推崇。我国颁布了国家层面的政策法规,着重推动国家级科学数据中心建设、科技项目数据资源汇交及数据出版。借鉴国外数据共享经验,结合国内实际发展情况,我国探索出具有中国特色的地球系统科学数据资源分类体系,在元数据、分布式互操作、大数据分析和共享服务等关键技术方面都取得了重大突破。本文以国家地球系统科学数据中心为例,系统梳理了国内地球系统科学领域的数据共享实践进展,详细介绍了国家在地球系统科学领域的数据共享实践及其成效。国家地球系统科学数据共享工作已探索形成成熟稳定的运行服务机制、研制出适用于多源分散地球系统科学数据的标准体系、 建成多学科多时空尺度的地球系统科学数据库群、自主研发海量异构数据共享网络技术体系与服务系统,促进了地球系统科学的科学发展,同时也推动了数据共享理念的传播与推广。然而,数据孤岛现象、共享服务系统标准化程度低、系统技术标准未对接国际规范等问题仍然较为突出,阻碍了地球系统科学数据开放与共享。未来,随着共享个性化需求被激活,定制化的“数据+知识”服务有望成为主流趋势,将给数据共享带来新的机遇和挑战。

  • 数据共享与数据挖掘
    刘菁菁, 刘雨思, 伊迪升, 杨静, 张晶
    地球信息科学学报. 2020, 22(6): 1370-1382. https://doi.org/10.12082/dqxxkx.2020.190594

    城市是多样性聚集的场所,且多元化和差异性日益增强,故探究土地混合利用具有一定的现实意义。现有的土地混合研究大多以POI(Point of Interest)为研究基础,着眼于城市主题的研究较少。本文采用百度POI数据,在街区尺度下考虑POI共现以提取主题,并挖掘北京市四环内的主题混合模式,其结果可以为城市规划及其建设提供参考。首先,采用LDA(Latent Dirichlet Allocation)主题模型得出街区的主题向量以及主题的POI共现模式;其次,引入多样性指数对街区的混合度进行度量,并依据自然断裂法将街区分为高混合街区、中等混合街区、低混合街区3类;最后,为了探究3类街区中的主题混合模式,先采用多元线性回归找出不同类街区中对混合度影响显著的主题,在此基础上对街区中的混合模式进行提取。结果表明:高混合街区的主题混合模式都是茶座餐厅主题与其他主题的混合;中等混合街区中的混合模式大多是以公司企业主题与住宅(商铺)主题再结合其他主题的混合;低混合街区中最典型的2种模式是茶座餐厅主题主导与风景名胜主题主导的接近单一的模式。不同的模式也体现了不同混合区的特征及其之间的差异,有助于对城市深度理解,从而为混合城市的建设提供参考。

  • 数据共享与数据挖掘
    别勇攀, 关庆锋, 姚尧
    地球信息科学学报. 2020, 22(6): 1383-1393. https://doi.org/10.12082/dqxxkx.2020.190472

    地理数据的增强现实(AR)技术,是地理信息可视化的重要发展方向之一。受限于头戴式AR设备有限的计算能力,已有的地理信息AR研究多集中于地理信息的可视化,并未提供复杂的空间分析计算功能。本文提出了一套基于边缘计算与云计算协同的AR空间分析计算框架。AR端完成空间数据的可视化、人机交互、数据预处理等;云端则完成复杂的空间分析计算任务以及空间数据的持久化存储;边云二元存储方法和三维可视化模型-三维地理模型间的坐标转换模块完成AR端和云端间的高效链接;从而达到高效率的、端对端的协同计算。基于该框架,本文利用头戴式AR设备Hololens,并基于武汉市的建筑物三维数据和天空可视因子算法,实现了在AR可视化的同时进行复杂的空间计算。结果表明,在保证空间分析计算效率和精度的同时,Hololens性能表现稳定,三维空间可视化的体验良好(FPS约35),证明了边云协同框架下的AR在空间分析计算具有广阔前景。

  • 数据共享与数据挖掘
    项秋亮, 邬群勇, 张良盼
    地球信息科学学报. 2020, 22(6): 1394-1405. https://doi.org/10.12082/dqxxkx.2020.190276

    现有OD流向聚类多将O点和D点相分离或者将OD流向看作4维空间的数据点进行聚类处理,忽视了流向长度、方向、时间对流向聚类的影响。本文以流向作为研究对象,提出一种基于流向间相似性度的逐级合并OD流向时空联合聚类算法。首先在充分研究OD流向的空间信息和时间信息的基础上,构建合理的OD流向间时空相似性度量方法,对OD流向间的时空相似性进行量化;然后提出逐级合并OD流向聚类策略,优化类簇合并的顺序,以减少层次聚类的时间开销,实现OD流向的时空联合聚类。以成都市的滴滴出行OD数据和纽约市出租车数据为例对本文方法进行了验证,结果表明:① 本算法聚类获得的流向类簇不仅带有空间特征还具备时间特征;② 在不同参数下本方法可以得到不同时空尺度的聚类结果;③ 与现有较高水平的流向聚类算法相对比,本文方法的聚类效果更好。这体现在流向类簇内部的流向之间有着充分的相似性,以及本文方法不仅可以提取出显著的流向类簇,还可以提取出非热点区域之间的流向类簇。本算法顾及空间因素和时间因素,可以通过调整时空相似性度量方法中的时间参数和空间参数以实现不同时空尺度的流向聚类,这使得从不同时空角度研究城市居民出行模式成为可能。本文提出的OD流向时空联合聚类算法从联合时间信息和空间信息的角度获得对运动数据的新见解,有助于合理全面地研究居民的移动模式、区域之间的空间联系、已知出行结构的确定以及出行目的的探索,是后续一系列分析工作的基础。