图/表 详细信息

基于DeepSeek的旅游行程链提取方法研究与实现
陈敏颉, 张政, 曹一冰, 张江水, 杨振凯, 卢正伦
地球信息科学学报, 2026, 28(3): 722-735.   DOI: 10.12082/dqxxkx.2026.250487

内容 说明
行程链完整性约束 ① 提取出行程链的摘要信息和每天的行程信息
② 提取出每天行程中的时间表达式、旅游节点、并推断节点之间的移动关系(路径)
③ 识别游客主要的旅游活动和行为,并将旅游节点与时间表达式、游客行为活动关联
④ 推断合理的交通工具和时间安排,并与路径关联
⑤ 补全可能缺失的时间信息
行程链逻辑性约束 ① 按时间顺序组织行程,检查时间顺序是否合理
② 旅游节点转换是否可行
③ 游客行为活动安排是否符合逻辑
④ 是否有矛盾的信息
时间格式标准化 ① 针对行程链中的“要素层”,时间统一采用yyyy-mm-dd格式
② 针对“特征层”,时间则使用yyyy-mm-dd hh:mm格式,并选择10分钟作为最小时间单元
③ 针对“上午”、“中午”、“下午”或“晚上”等模糊时间段,将其转换为相应的小时值。例如,“早上”为8:00—11:00,“中午”为11:00—13:00,“下午”为13:00—18:00,“晚上”为18:00—22:00
字段约束 ① 添加字段注释说明:在提示词中明确字段含义及单位,如设置字段的单位“元”“小时”等,或对字段进行解释和说明
② 设置字段的示例值:描述性字段可根据实际需求提供参考值,并结合正则表达式对输出结果进行清洗,如提供具体的交通工具类型作为参考
③ 缺失字段显式处理:补全可能缺失的逻辑连接,检查后将字段值设为null
表1 格式约束的详细内容与说明
本文的其它图/表