【目的】现阶段台风灾害知识服务常面临着“数据海量、知识难求、服务受限”的困境,如何从海量数据中快速凝练知识,提升台风灾害知识服务水平,减轻灾害带来的破坏性影响是当前研究的关键。大语言模型(LLMs)在自然语言处理领域展示出优异的性能,能够有效挖掘各类灾害信息,为深度灾害知识服务提供有效支撑。【方法】本研究深入解析了LLMs在台风灾害领域的应用前景,搭建了涵盖数据、知识、服务的台风灾害知识服务方法。【结果】就数据层到知识层而言,提出了基于Qwen2.5-Max的台风灾害知识图谱自动化构建方法。该方法首先提出了多层次台风灾害知识表达模型,而后构建了顾及时空特征和灾情影响的台风文本训练数据集。在此基础上采用“预训练+微调”的技术范式,实现了灾害数据到灾害知识的快速凝练。就知识层到服务层而言,提出了基于Qwen2.5-Max的台风灾害智能问答方法。该方法利用构建的台风灾害知识图谱,采取图检索增强生成(GraphRAG)方法,实现了基于图的灾害知识检索与面向用户的个性化防灾减灾指导方案生成。【结论】本研究充分展示了LLMs在台风灾害领域的广泛应用前景,也为LLMs与地理信息技术的交叉融合打下了基础,有望推动地理人工智能的进一步发展。
【目的】针对IFC标准的建筑信息模型(BIM)在实际应用中存在几何优先、语义弱化、跨软件语义丢失等问题,借鉴知识图谱及其推理算法(TransE)模型,将BIM模型信息进行网络化语义表达,通过增强模型的几何和语义关联性,解决跨平台交互语义丢失问题。【方法】以Revit软件库自带三层建筑模型为实验对象,将TransE模型应用于BIM语义信息的提取。BIM语义信息首先分解为构件语义、关联语义、坐标语义3种,建立构件节点的IfcEntity动态标签及关联节点的静态关系属性标签,提取了2 453个BIM语义节点、14 844条关联关系。【结果】实验及结果表明: ① 知识图谱能有效地将BIM模型构件及复杂关系进行图形化表达; ② 对比不同参数组合下TransE模型性能指标(MRR\Hits@n)发现:嵌入维度与模型性能成正比,学习率与模型性能成反比; ③ 当嵌入维度为200、学习率为0.000 5时,模型的评价指标最优; ④ 通过搜索系统查询所有构件节点进行结果验证发现,BIM构件语义信息提取成功率为94.47%。【结论】本文所倡导方法适用于BIM语义信息的提取及其更深层次的语义分析,研究结果为BIM与GIS集成提供一种语义转换的新途径。
【目的】全球离散格网系统(Discrete Global Grid Systems,DGGS)本质上是多尺度栅格结构,地理空间矢量与格网的集成是难点,矢量线格网化是其中的基本问题。现有方案多以平面格网单元中心(格心)连线为矢量线建模结果,但扩展到球面后建模精度降低,本文针对这一缺陷提出矢量线全球离散格网系统高精度建模方法。【方法】首先选择与地球拟合程度更高的菱形三十面体构建六边形格网系统,以3个相邻菱形面构成组合结构并建立三轴整数坐标系描述单元空间位置;然后根据矢量线首尾端点所在单元确定最优方向编码以减少搜索范围,通过编码邻近运算搜索矢量线经过的球面单元,以球面格心连线为建模结果并提出跨面矢量线处理方法;最后增加单元顶点(格点)作为结构要素,实现多结构要素矢量线建模,进一步提高建模精度。【结果】实验结果表明:本文方案能正确实现全球各个大洲海岸线格网化建模,确保格网化单元与矢量线拓扑相交,且相较平面格网建模结果兼具精度和效率优势。【结论】针对传统矢量数据格网建模方法的几何精度损失和拓扑畸变问题,本文提出高精度球面格网化建模方法,为矢量数据转换至格网同构处理提供有力支撑。
【目的】精确识别城市河流浊度分布对于了解城市水环境质量、评估污染状况和优化水资源管理具有重要意义。目前,在水质遥感反演研究中,一般先依据相关系数选择建模的敏感波段或组合,然后建立反演模型。然而,由于常用卫星遥感数据的光谱波段范围较宽且波段数量有限,寻找敏感波段或波段组合的过程存在不确定性。【方法】本文提出了一种基于卷积神经网络(Convolutional Neural Network,CNN)的浊度反演方法,该模型由4个卷积层、2个池化层和4个全连接层组成。以郑州市东风渠和熊耳河水体为研究对象,基于Planet卫星数据、实测浊度数据和光谱数据,利用CNN模型对河流水体浊度进行遥感反演,并与2种回归分析方法和3种经典机器学习方法进行精度对比,最终生成研究区浊度空间分布图。【结果】研究区浊度反演的决定系数(R2)达到0.908,均方根误差(RMSE)为0.410 NTU,相较于最优回归分析模型和最优经典机器学习方法分别提升39.6%和6.5%。通过“目测+实地采样+实验室水质分析”的方式对结果进行了验证,结果表明,CNN模型生成的浊度分布图与实际采样数据和实地调查结果基本一致,研究区浊度平均值为3.52 NTU,标准差为1.003 NTU,变异系数为0.28。【结论】本研究表明卷积神经网络方法能够有效捕捉遥感影像中的非线性和高维数据复杂关系,可以提高河流水体浊度遥感反演的精度。
【目的】随着我国城市化进程的深入和市场竞争的加剧,长时间工作已成为普遍的社会问题,对劳动者身心健康与城市可持续发展构成挑战。当前关于城市居民工作活动的研究多依赖问卷调查数据,样本量有限且缺乏针对特大城市长时间工作现象的探究。【方法】本研究基于长时序手机信令数据,提出了一个识别长时间工作者的技术框架,系统分析了2019年11月份北京市长时间工作现象的空间分布特征。【结果】研究发现,北京市长时间工作者(周工作时长≥40 h)占比达47.1%,平均周工作时长48.86 h,其空间分布呈现“多中心集聚”格局,集中于CBD、金融街、中关村及亦庄等就业聚集区。不同性别和年龄群体分异显著:男性平均周工作时长(49.62 h)较女性(48.14 h)高1.5 h; 20~29岁男性群体的平均周工作时长(50.68 h)最长,而30~39岁女性群体尽管人数占比最高(22.13%),但其平均周工作时长(47.59 h)反而最低。此外,不同类型就业聚集区的长时间工作特征呈现明显的分异规律:CBD和中关村等区域的长时间工作人数更多,亦庄地区的长时间工作者占比最高(58.0%),而新发地、马驹桥等批发物流基地的工作强度更大(平均周工作时长均超过50 h)。【结论】本研究为深入理解北京市长时间工作现象提供了丰富的实证依据,研究结果为优化劳动时间政策提供了数据支持,对促进城市可持续发展和社会公平具有现实意义。