地球信息科学学报 ›› 2016, Vol. 18 ›› Issue (12): 1597-1607.doi: 10.3724/SP.J.1047.2016.01597
收稿日期:
2016-08-04
修回日期:
2016-10-18
出版日期:
2016-12-27
发布日期:
2016-12-20
通讯作者:
孟斌
E-mail:lyzhang1980@cup.edu.cn;mengbin@buu.edu.cn
作者简介:
作者简介:张丽英(1980-),女,河南社旗人,博士生,研究方向为时空数据挖掘。E-mail:
基金资助:
ZHANG Liying1,2(), MENG Bin3,*(
), YIN Qin4
Received:
2016-08-04
Revised:
2016-10-18
Online:
2016-12-27
Published:
2016-12-20
Contact:
MENG Bin
E-mail:lyzhang1980@cup.edu.cn;mengbin@buu.edu.cn
摘要:
轨道站点是城市轨道交通基本线网系统中的关键节点,科学的轨道站点分类,对了解城市功能分区及评价轨道交通基础设施建设情况具有重要意义。轨道交通站点时间序列客观记录了所观测的站点在各个时刻点的重要信息,研究其时间序列聚类,是认识和理解轨道交通站点时间序列形成本质的重要手段,也是挖掘轨道交通站点时间序列中隐含的有较高价值规律知识的重要方法。本文以北京IC卡轨道站点刷卡数据为研究对象,提出了描述轨道站点的4个数据集,即工作日进站数据集(WB)、工作日出站数据集(WA)、休息日进站数据集(RB)和休息日出站数据集(RA);并首次引入时间序列分析方法(符号集合近似(SAX)方法)对4个数据集进行聚类分析,实现了高维数据的有效降维和轨道站点之间的相似性度量。采用层次聚类方法并根据聚类有效性DB指数确定将195个站点分为8类更为合理。通过分析每类站点的日客流特征和空间位置分布情况,为轨道交通站点规划设计和管理服务提供一定的客观参考依据。
张丽英, 孟斌, 尹芹. 基于符号集合近似的城市轨道交通站点分类研究[J]. 地球信息科学学报, 2016, 18(12): 1597-1607.DOI:10.3724/SP.J.1047.2016.01597
ZHANG Liying,MENG Bin,YIN Qin. Classification of Urban Rail Transit Stations based on SAX[J]. Journal of Geo-information Science, 2016, 18(12): 1597-1607.DOI:10.3724/SP.J.1047.2016.01597
表3
8类轨道站点的曲线特征"
类别 | 工作日曲线特征 | 休息日曲线特征 | ||||||
---|---|---|---|---|---|---|---|---|
进站 | 出站 | 进站 | 出站 | |||||
峰值及时间 | 峰值个数 | 峰值及时间 | 峰值个数 | 峰值及时间 | 峰值个数 | 峰值及时间 | 峰值个数 | |
1 | 4.53 7:00 | 1 | 3.33 18:00 | 1 | 0.74 8:00 | 1 | 0.82 18:00 | 1 |
2 | 3.04 18:00 | 1 | 5.45 8:00 | 1 | 0.26 17:00 | 1 | 0.31 8:00 | 1 |
3 | 4.27 7:00 0.96 17:00 | 2 | 1.26 8:00 3.20 18:00 | 2 | 0.58 8:00 0.13 17:00 | 2 | -0.12 8:00 0.68 18:00 | 2 |
4 | 3.82 8:00 0.68 18:00 | 2 | 0.58 8:00 2.90 18:00 | 2 | 0.74 9:00 0.65 16:00 | 2 | 0.47 11:00 1.15 17:00 | 2 |
5 | 1.49 17:00 -0.11 21:00 | 2 | 1.93 8:00 0.07 13:00 0.23 18:00 | 3 | 2.34 16:00 | 1 | 2.05 10:00 1.66 14:00 | 2 |
6 | 2.27 8:00 2.56 17:00 | 2 | 4.43 8:00 2.07 18:00 | 2 | 0.14 9:00 0.30 15:00 | 2 | 0.22 8:00 0.34 17:00 | 2 |
7 | 1.42 8:00 2.47 17:00 | 2 | 3.60 8:00 1.65 18:00 | 2 | 0.08 10:00 0.95 16:00 | 2 | 0.80 8:00 0.37 13:00 0.49 17:00 | 3 |
8 | 0.10 7:00 -0.33 10:00 0.31 12:00 0.50 15:00 | 4 | 0.88 8:00 -0.15 11:00 -0.22 13:00 -0.16 15:00 0.41 18:00 | 5 | 1.20 9:00 0.78 12:00 1.11 17:00 | 3 | 0.68 11:00 2.66 17:00 | 2 |
表4
层次聚类8类结果类"
类别 | 站点数量 | 站点名称 |
---|---|---|
1 | 41 | 八里桥 北宫门 草房 常营 传媒大学 次渠 次渠南 褡裢坡 稻田 俸伯 巩华城 管庄 广阳城 果园 黄村火车站 黄渠 回龙观 回龙观东大街 霍营 旧宫 梨园 良乡大学城西 临河里 龙泽 苹果园 沙河 沙河高教园 生命科学园 石门 天通苑 天通苑北 天通苑南 通州北苑 土桥 西红门 西苑 小红门 新宫 育新 枣园 朱辛庄 |
2 | 39 | 白石桥南 朝阳门 车公庄 车公庄西 磁器口 大望路 大钟寺 灯市口 东大桥 东单 东四十条 阜成门 复兴门 高碑店 国贸 海淀黄庄 呼家楼 惠新西街北口 建国门 金台夕照 亮马桥 灵镜胡同 柳芳 木樨地 南礼士路 荣京东街 三元桥 苏州街 团结湖 万源街 五道口 西二旗 西土城 宣武门 雍和宫 永安里 张自忠路 知春里 中关村 |
3 | 34 | 安和桥北 八宝山 八角游乐园 北苑 慈寿寺 崔各庄 高米店北 公益西桥 古城路 海淀五路居 后沙峪 花梨坎 角门西 劲松 九棵树 立水桥 立水桥南 林萃桥 刘家窑 马家堡 南法信 蒲黄榆 青年路 十里堡 双桥 四惠东 宋家庄 孙河 陶然亭 同济南路 亦庄桥 亦庄文化园 永泰庄 玉泉路 |
4 | 14 | 高米店南 黄村西大街 篱笆房 良乡南关 马泉营 南邵 清源路 顺义 苏庄 天宫院 肖村 义和庄 圆明园 长阳 |
5 | 10 | 奥林匹克公园 奥体中心 北海北 动物园 南锣鼓巷 森林公园南门 天安门东 天安门西 王府井 西单 |
6 | 33 | 安定门 安华桥 安贞门 北土城 北苑路北 菜市口 大葆台 大屯路东 鼓楼大街 光熙门 和平里北街 和平门 和平西桥 花园桥 惠新西街南口 健德门 金台路 经海路 牡丹园 荣昌东街 上地 芍药居 生物医药基地 双井 四惠 太阳宫 万寿路 望京 望京西 五棵松 西小口 长椿街 知春路 |
7 | 22 | 巴沟 北京大学东门 北京南站 北京站 北新桥 崇文门 东四 东直门 郭公庄 国家图书馆 国展 积水潭 军事博物馆 农业展览馆 平安里 前门 人民大学 天坛东门 魏公村 西四 西直门 新街口 |
8 | 2 | 良乡大学城 良乡大学城北 |
[1] | 北京交通发展研究中心.2013年北京市交通发展年度报告[R].北京:北京交通发展研究中心,2013. |
[ Beijing Transportation Research Center. Beijing transportation annual report 2013[R]. Beijing: Beijing Transportation Research Center, 2013 ] | |
[2] | 段德罡,张凡.土地利用优化视角下的城市轨道站点分类研究——以西安地铁2号线为例[J].城市规划,2013,37(9):39-45. |
[ Duan D G, Zhang F.Study on classification of urban rail transit stations from the perspective of land use optimization: A case study on Xi′an subway line 2[J]. City Planning Review, 2013,37(9):39-45. ] | |
[3] | Korf J L,Demetsky MJ. Analysis of rapid transit access mode choice. Transportation research record.1981,817:29-35. |
[4] | Bates Jr EG.A study of passenger transfer facilities(abridgment)[J]. Transportation research record, 1978,662:23-25. |
[5] | 谢屾. 城市轨道交通站点周边空间形态整合浅析:以南京为例[D].南京:南京大学,2011. |
[ Xie S.Study on morphological integration of space surrounding urban rail transit stations: A case study of Nanjing[D]. Nanjing: Nanjing University, 2011. ] | |
[6] | 龚晓芳. 现代城市轨道交通站点地区规划研究[D].西安:长安大学,2009. |
[ Gong X F.The planning research of metro rail transit station in modern city[D]. Xi′an: Chang′an University, 2009. ] | |
[7] |
吴娇蓉,毕艳祥,傅博峰.基于郊区轨道交通站点分类的客流特征和换乘系统优先级分析[J].城市轨道交通研究,2007,10(11): 23-28.
doi: 10.3969/j.issn.1007-869X.2007.11.007 |
[ Wu J R, Bi Y X, Fu B F.Characteristics of in passenger different suburban rail stations and the priority of transfer system[J]. Urban Mass Transit, 2007,10(11):23-28. ]
doi: 10.3969/j.issn.1007-869X.2007.11.007 |
|
[8] |
傅搏峰,吴娇蓉,陈小鸿.郊区轨道站点分类方法研究[J].铁道学报,2008,30(6):19-23.
doi: 10.3321/j.issn:1001-8360.2008.06.004 |
[ Fu B F, Wu J R, Chen X H.Method of classification of suburban rail transit station sites[J]. Journal of the China Railway Society, 2008,30(6):19-23. ]
doi: 10.3321/j.issn:1001-8360.2008.06.004 |
|
[9] |
余丽洁,李岩,陈宽民.基于谱聚类的城市轨道站点分类方法[J].交通信息与安全,2014,32(1):122-125,129.
doi: 10.3963/j.issn1674-4861.2014.01.025 |
[ Yu L J, Li Y, Chen K M.Using spectral clustering for urban rail station classification[J]. Journal of Transport Information and Safety, 2014,32(1):122-125,129. ]
doi: 10.3963/j.issn1674-4861.2014.01.025 |
|
[10] |
马小毅,金安,刘明敏,等.广州市轨道交通客流特征分析[J].城市交通,2013,11(6):35-42.
doi: 10.3969/j.issn.1672-5328.2013.06.007 |
[ Ma X Y, Jin A, Liu M M, et al. Rail transit passenger flow characteristics in guangzhou[J].Urban Transport of China, 2013,11(6):35-42. ]
doi: 10.3969/j.issn.1672-5328.2013.06.007 |
|
[11] |
王静,刘剑锋,马毅林,等.北京市轨道交通车站客流时空分布特征.城市交通,2013,11(6):18-27.
doi: 10.3969/j.issn.1672-5328.2013.06.005 |
[ Wang J, Liu J F, Ma Y L, et al. Temporal and spatial passenger flow distribution characteristics at rail transit stations in beijing[J]. Urban Transport of China, 2013,11(6):18-27. ]
doi: 10.3969/j.issn.1672-5328.2013.06.005 |
|
[12] | 谭啸. 天津城市轨道交通站点周边土地利用优化研究[D].天津:天津大学,2012. |
[ Tan X.Study on optimization of land-use surrounding the urban rail station in Tianjin[D]. Tianjin: Tianjin University, 2012. ] | |
[13] |
龙瀛,张宇,崔承印.利用公交刷卡数据分析北京职住关系和通勤出行[J].地理学报,2012,67(10):1339-1352.
doi: 10.11821/xb201210005 |
[ Long Y, Zhang Y, Cui C Y.Identifying commuting pattern of beijing using bus smart card data[J]. Acta Geographica Sinica, 2012,67(10):1339-1352. ]
doi: 10.11821/xb201210005 |
|
[14] |
Ali A, Kim J, Lee S.Travel behavior analysis using smart card data[J]. KSCE Journal of Civil Engineering, 2016,20(4):1532-1539.
doi: 10.1007/s12205-015-1694-0 |
[15] | Gitanjali J.Data mining from smart card data using data clustering[J]. International Journal of Applied Engineering Research, 2016,11(1):347-352. |
[16] |
Long Y, Thill J C.Combining smart card data and household travel survey to analyze jobs-housing relationships in Beijing[J]. Computers, Environment and Urban Systems, 2015,53:19-35.
doi: 10.1016/j.compenvurbsys.2015.02.005 |
[17] | Joh C, Hwang C.Time-geographic analysis of trip trajectories and land use characteristics in Seoul metropolitan area by using multidimensional sequence alignment and spatial analysis[C]. 2010 AAG Annual Meeting, Washington, DC, 2010. |
[18] |
Jang W.Travel time and transfer analysis using transit smart card data[J]. Transportation Research Record: Journal of the Transportation Research Board, 2010,2144(1):142-149.
doi: 10.3141/2144-16 |
[19] | Bagchi M, White P R.Use of public transports smart card data for understanding travel behavior[C]. Proceedings of the European Transport Conference, Strasbourg, 2003. |
[20] | Roth C, Kang S M, Batty M, et al. Structure of urban movements: polycentric activity and entangled hierarchical flows[J]. PloS one,2011,6(1):e15923. |
[21] |
Ma X, Wu Y J, Wang Y, et al. Mining smart card data for transit riders’ travel patterns[J].Transportation Research Part C: Emerging Technologies, 2013,36:1-12.
doi: 10.1016/j.trc.2013.07.010 |
[22] |
尹芹,孟斌,张丽英.基于客流特征的北京地铁站点类型识别[J].地理科学进展,2016,35(1):126-134.
doi: 10.18306/dlkxjz.2016.01.014 |
[ Yin Q, Meng B, Zhang L Y. 2016. Classification of subway stations in Beijing based on passenger flow characteristics[J].Progress In Geography,2016,35(1):126-134. ]
doi: 10.18306/dlkxjz.2016.01.014 |
|
[23] |
戴霄,陈学武,李文勇.公交IC卡信息处理的数据挖掘技术研究[J].交通与计算机,2006,24(1):40-42.
doi: 10.3963/j.issn.1674-4861.2006.01.012 |
[ Dai X, Chen X W, Li W Y.Study of data mining technique for bus intelligent card data processing[J]. Computer and Communications, 2006,24(1):40-42. ]
doi: 10.3963/j.issn.1674-4861.2006.01.012 |
|
[24] |
杨智伟,赵骞,赵胜川,等. 基于公交IC卡数据信息的客流预测方法研究[J].交通标准化,2009(9):115-119.
doi: 10.3869/j.issn.1002-4786.2009.05.056 |
[ Yang Z W, Zhao Q, Zhao S C, et al. Passenger flow volume forecasting method based on public transitintelligent card (IC) survey data. Transport Standardization, 2009,9:115-119. ]
doi: 10.3869/j.issn.1002-4786.2009.05.056 |
|
[25] | 何晓旭. 时间序列数据挖掘若干关键问题研究[D].中国科学技术大学,2014. |
[ He X X.Study on several key issues of time series data mining[D]. University of Science and Technology of China, 2014. ] | |
[26] |
宋辞,裴韬.基于特征的时间序列聚类方法研究进展[J].地理科学进展,2012,31(10):1307-1317.
doi: 10.11820/dlkxjz.2012.10.008 |
[ Song C, Pei T.Research progress in time series clustering methods based on characteristics. Progress in Geography, 2012,31(10):1307-1317. ]
doi: 10.11820/dlkxjz.2012.10.008 |
|
[27] | Faloutsos C, Ranganathan M, Manolopoulos Y.Fast subsequence matching in time-series databases[C]. Proceedings of the 1994 ACM SIGMOD International Conference on Management of Data, 1994. |
[28] | Chan K P, Fu A C.Efficient time series matching by wavelets[C]. Proceedings - International Conference on Data Engineering, 1999:126-133. |
[29] | Keogh E, Chakrabarti K, Pazzani M, et al. Locally adaptive dimensionality reduction for indexing large time series databases[J]. ACM SIGMOD Record, 2001,30(2):151-162. |
[30] | Keogh E, Lin J, Fu A.Hot sax: Efficiently finding the most unusual time series subsequence[C]. Data mining,IEEE fifth international conference on, 2005:226-233. |
[31] |
Lin J, Keogh E, Wei L, et al. Experiencing SAX: a novel symbolic representation of time series[J]. Data Mining and knowledge discovery, 2007,15(2):107-144.
doi: 10.1007/s10618-007-0064-z |
[32] |
Keogh E, Chakrabarti K, Pazzani M, et al. Dimensionality reduction for fast similarity search in large time series databases[J]. Knowledge and information Systems, 2001,3(3):263-286.
doi: 10.1007/PL00011669 |
[33] |
Hung N, Anh D.An improvement of PAA for dimensionality reduction in large time series databases[J]. PRICAI 2008: Trends in Artificial Intelligence, 2008,5351:698-707.
doi: 10.1007/978-3-540-89197-0_64 |
[34] | Camerra A, Palpanas T, Shieh J, et al. iSAX 2.0: Indexing and mining one billion time series[C]. Data Mining (ICDM), 2010 IEEE 10th International Conference on, IEEE, 2010. |
[35] |
李桂玲,王元珍,杨林权,等.基于SAX的时间序列相似性度量方法[J].计算机应用研究,2012,29(3):893-896.
doi: 10.3969/j.issn.1001-3695.2012.03.025 |
[ Li G L,Wang Y Z,Yang L Q, et al. Research on similarity measure for time series based on SAX[J]. Application Research of Computers, 2012,29(3):893-896. ]
doi: 10.3969/j.issn.1001-3695.2012.03.025 |
|
[36] |
刘威,邵良杉,曾繁慧,等.基于SAX方法的股票时间序列数据相似性度量方法研究[J].计算机工程与科学,2009,31(9):115-118.
doi: 10.3969/j.issn.1007-130X.2009.09.037 |
[ Liu W, Shao L S, Zeng F H, et al. Research on the stock time series data similarity based on sax[J].Computer Engineering&Science, 2009,31(9):115-118. ]
doi: 10.3969/j.issn.1007-130X.2009.09.037 |
|
[37] |
秦萧,甄峰,熊丽芳,等.大数据时代城市时空间行为研究方法[J].地理科学进展,2013,32(9):1352-1361.
doi: 10.11820/dlkxjz.2013.09.005 |
[ Qin X, Zhen F, Xiong L F, et al. Methods in urban temporal and spatial behavior research in the big data era[J].Progress in Geography, 2013,32(9):1352-1361. ]
doi: 10.11820/dlkxjz.2013.09.005 |
|
[38] | 谭璐. 高维数据的降维理论及应用[D].长沙:国防科学技术大学,2005. |
[ Tan L.The theory and application of the dimension reduction on the high-dimensional data set[D]. Changsha: National University of Defense Technology,2005. ] | |
[39] |
郝晓军,闫京海,樊友谊.大数据分析过程中的降维方法[J].航天电子对抗,2014,30(4):58-60.
doi: 10.3969/j.issn.1673-2421.2014.04.016 |
[ Hao X J, Yan J H, Fan Y Y.Dimensionality reduction of large volumes of data analysis[J]. Aerospace Electronic Warfare, 2014,30(4):58-60. ]
doi: 10.3969/j.issn.1673-2421.2014.04.016 |
|
[40] |
Lin J, Keogh E, Lonardi S, et al. A symbolic representation of time series, with implications for streaming algorithms. Proceedings of the 8th ACM SIGMOD workshop on Research issues in data mining and knowledge discovery, 2003:2-11.
doi: 10.1145/882082.882086 |
[41] | Kaufman L, Rousseeuw P J.Finding groups in data: an introduction to cluster analysis[M]. John Wiley & Sons, 2009:157-159. |
[42] | 王开军,李健,张军英,等.聚类分析中类数估计方法的实验比较[J].计算机工程,2008,34(9):198-199. |
[ Wang K J, Li J, Zhang J Y, et al. Experimental comparison of clusters number estimation for cluster analysis[J]. Computer Engineering, 2008,34(9):198-199. ] | |
[43] | 林琳,卢道典.广州重大交通设施建设与空间结构演化研究[J].地理科学,2011,31(9):1050-1055. |
[ Lin L, Lu D D.Major transportation facility and spatial structure evolution in guangzhou[J]. Scientia Geographica Sinica, 2011,31(9):1050-1055. ] | |
[44] |
曹小曙,薛德升,阎小培.城市交通运输地理发展趋势[J].地理科学,2006,26(1):111-117.
doi: 10.3969/j.issn.1000-0690.2006.01.019 |
[ Cao X S, Xue D S, Yan X P.Development tendency of urban transport geography[J]. Scientia Geographica Sinica, 2006,26(1):111-117. ]
doi: 10.3969/j.issn.1000-0690.2006.01.019 |
[1] | 谢聪慧, 吴世新, 张晨, 孙文涛, 何海芳, 裴韬, 罗格平. 基于谱系聚类的全球各国新冠疫情时间序列特征分析[J]. 地球信息科学学报, 2021, 23(2): 236-245. |
[2] | 杜毅贤, 徐家鹏, 钟琳颖, 侯盈旭, 沈婕. 网络舆情态势及情感多维特征分析与可视化——以COVID-19疫情为例[J]. 地球信息科学学报, 2021, 23(2): 318-330. |
[3] | 高楹, 宋辞, 郭思慧, 裴韬. 接驳地铁站的共享单车源汇时空特征及其影响因素[J]. 地球信息科学学报, 2021, 23(1): 155-170. |
[4] | 刘新, 赵宁, 郭金运, 郭斌. 基于LSTM神经网络的青藏高原月降水量预测[J]. 地球信息科学学报, 2020, 22(8): 1617-1629. |
[5] | 项秋亮, 邬群勇, 张良盼. 一种逐级合并OD流向时空联合聚类算法[J]. 地球信息科学学报, 2020, 22(6): 1394-1405. |
[6] | 王家丰, 王蓉, 冯永玖, 雷振坤, 高忱, 陈书睿, 金雁敏, 翟淑婷. 顾及轨道交通影响的浙中城市群土地利用多情景模拟与分析[J]. 地球信息科学学报, 2020, 22(3): 605-615. |
[7] | 杨丹, 周亚男, 杨先增, 郜丽静, 冯莉. LSTM支持下时序Sentinel-1A数据的太白山区植被制图[J]. 地球信息科学学报, 2020, 22(12): 2445-2455. |
[8] | 郑诗晨, 盛业华, 吕海洋. 基于粒子滤波的行车轨迹路网匹配方法[J]. 地球信息科学学报, 2020, 22(11): 2109-2117. |
[9] | 周玲, 李云梅, 赵焕, 房晟忠, 颜翔, 吕恒. 滇池湖滨带植被时空变化及其对滇池总磷浓度的影响[J]. 地球信息科学学报, 2020, 22(10): 1946-1958. |
[10] | 易嘉伟, 杜云艳, 涂文娜. 基于位置大数据的国庆假期青藏高原人群分布 时空变化模式挖掘[J]. 地球信息科学学报, 2019, 21(9): 1367-1381. |
[11] | 胡顺石, 张辰璐, 彭雨龙, 谭子芳. 湖南省不同云状态的时空特征分析[J]. 地球信息科学学报, 2019, 21(5): 688-698. |
[12] | 刘凯, 彭力恒, 李想, 谭敏, 王树功. 基于Google Earth Engine的红树林年际变化监测研究[J]. 地球信息科学学报, 2019, 21(5): 731-739. |
[13] | 郑海亮, 房世峰, 刘成程, 吴金华, 杜加强. 青藏高原月NDVI时空动态变化及其对气候变化的 响应[J]. 地球信息科学学报, 2019, 21(2): 201-214. |
[14] | 黄葵, 卢毅敏, 魏征, 陈鹤, 张宝忠, 马文津. 土地利用和气候变化对海河流域蒸散发时空变化的影响[J]. 地球信息科学学报, 2019, 21(12): 1888-1902. |
[15] | 王诚聪, 刘亚静, 刘明月. 全球恐怖袭击事件时空演变与态势分析[J]. 地球信息科学学报, 2019, 21(11): 1710-1720. |
|