网络文本蕴含地理信息质量评估框架
黄宗财, 陆锋, 仇培元, 彭澎

A Quality Assessment Framework for Implicit Geographic Information from Web Texts
HUANG Zongcai, LU Feng, QIU Peiyuan, PENG Peng
表3 QAF-GIWT中可靠性的维度、指标与值获取方式
Tab. 3 Dimensions, indicators and value acquisition methods of reliability in QAF-GIWT
维度 层次 指标 值获取方式 公式编号
可靠性 数据源(网站) 综合排名 API直接获取
类别排名 API直接获取
日均网页访问量 API直接获取
日均用户访问量 API直接获取
域名时长 域名时长=当前时间-域名创建时间
数据源(网页) 用户关注数量 爬取
网页的点赞数、转载数、阅读数、评论数、收藏数 爬取
文字数量、图片数量 计算
数据项(三元组) 地理实体比率 G E R = E S G e o N W (12)
窗口地理信息含量比率 G I W R = G e o i n f o w i n f o w (13)
数据集(GeoKG) 平均可靠性 平均可靠性=可靠性总和/数据项数量 (14)