工业污染对癌症影响的挖掘方法:改进的空间同位模式
张玲莉, 王丽珍, 杨培忠

Mining the Influence of Industrial Pollution on Cancer: An Improved Spatial Co-location Pattern
ZHANG Lingli, WANG Lizhen, YANG Peizhong
算法1 基于KDE模型的空间序偶模式挖掘算法
输入:1污染源空间数据集 P S,癌症空间数据集 C S
2拉伸系数 λ,风速 v
3污染源实例影响半径 r m i n r m i d r m a x;癌症病人活动半径 r c
4致癌系数 ε 1 ε 2 ε 3
5平滑因子 δ
6影响度阈值 m i n _ p i i
输出:所有频繁空间序偶模式 S O P P _ c
变量: P S _ l m C o n c:带有局部平均浓度信息的污染源实例集
    g m _ C o n c S:污染源实例的全局平均浓度集
    S N S:所有癌症实例的星型邻居集
    k  :模式的阶数
    C k k阶候选模式
    i n s _ T k C k的星型影响实例表集
    P k k阶频繁模式
步骤:
1 P S= get_wind_influence_PS( λ, v, P S)
2 P S _ l m C o n c = get_local_mean_Concentration( P S)
3 g m _ C o n c S = get_global_mean_Concentration( P S _ l m C o n c)
4 S N S  = gen_star_neighbor_set ( C S , r m i n , r m i d , r m a x , r c , P S _ l m C o n c ,
g m _ C o n c S)
5 C 2= gen_candidate_patterns ( S N S)
6 k=2
7 WHILE( C k NULL)
i n s _ T k = gen_InsTable ( C k, S N S  )
  P k = gen_prev_SOPP ( C k , i n s _ T k , ε 1 , ε 2 , ε 3 , δ , m i n _ p i i)
  S O P P _ c S O P P _ c P k
    C k + 1= gen_candidate_patterns( S N S)
k=k+1
8 RETURN     S O P P _ c