基于多源空间数据和随机森林模型的长沙市茶颜悦色门店选址与预测研究
黄钦, 杨波, 徐新创, 郝汉舟, 梁莉莉, 王敏

Location Selection and Prediction of SexyTea Store in Changsha City based on Multi-source Spatial Data and Random Forest Model
HUANG Qin, YANG Bo, XU Xinchuang, HAO Hanzhou, LIANG Lili, WANG Min
表2 统计分析模型及其释义
Tab. 2 Statistical analysis model and its interpretation
模型名称 模型公式 模型释义 地理意义 编号
平均最近邻指数 ANN = D - 0 D - E ANN为平均最近邻指数; D - 0表示每个要素与最邻近要素之间的平均观测距离; D - E表示随机模式下要素间的预期平均距离 ANN<1时,要素分布趋势为集聚型; ANN=1时为随机型; NNI>1时为离散型 (1)
地理集中指数 G = 100 × i = 1 n x i T 2 G为地理集中指数; x i为第 i个区县内茶颜悦色门店的数量; T为茶颜悦色门店总数; n为长沙市区县数量 G的取值介于0~100之间, G值越小,表明门店分布越分散; G值越高,则分布越集中 (2)
不平衡指数 S = i = 1 n Y i - 50 n + 1 100 n - 50 n + 1 S为不平衡指数; n为区县个数; Y i为各区县茶颜悦色门店数量在全市总数所占比重从小到大排序后,第 i位的累计百分比 S的取值介于0~1之间, S值越大表明不平衡性越高 (3)
标准差椭圆 SD E x = i = 1 n x i - X - 2 SD E y = i = 1 n y i - Y - 2 SD E x SD E y分别为标准差椭圆xy轴方向上的轴长; x i , y i为茶颜悦色门店的空间坐标; X - , Y -为门店的平均中心; n为门店总数 对地理要素的集中、离散和方向趋势进行定量描述,直观展现其空间分布的中心性及延展性 (4)
核密度估计 f x = i = 1 n 1 r 2 k x - x i r f x为核密度函数;n为与空间位置x的距离小于或等于r的要素数;k为空间权重函数;r为距离衰减阈值;n为与位置x的距离小于或等于r的要素点数 用以测度点状要素在空间上的集聚状态,核密度值越大,表明其空间分布越密集 (5)