新时代地图的机遇与挑战

一种基于多因子贝叶斯决策的泛在地图图像视觉平衡度计算框架

  • 徐晔秋 , 1 ,
  • 杨剑 1 ,
  • 贾奋励 , 1, * ,
  • 杨磊 2 ,
  • 郭丽萍 3 ,
  • 王维明 4
展开
  • 1.信息工程大学地理空间信息学院,郑州 450052
  • 2.61363部队,西安 710054
  • 3.61175部队,南京 210049
  • 4.61243部队,乌鲁木齐 830000
* 贾奋励(1976— ),女,河北武安人,博士,副教授,主要从事空间认知、全息地图与虚拟地理环境研究。 E-mail:

徐晔秋(1995— ),男,江苏苏州人,硕士生,主要从事虚拟地理环境研究。E-mail:

Copy editor: 蒋树芳

收稿日期: 2022-10-05

  修回日期: 2022-12-13

  网络出版日期: 2024-03-26

基金资助

国家自然科学基金项目(42130112)

国家自然科学基金项目(41671407)

国家自然科学基金项目(41901335)

国家重点研发计划项目(2017YFB0503500)

A Calculation Framework of Visual Balance Index of Ubiquitous Map Images Based on Multi-factor Bayesian Decision Making

  • XU Yeqiu , 1 ,
  • YANG Jian 1 ,
  • JIA Fenli , 1, * ,
  • YANG Lei 2 ,
  • GUO Liping 3 ,
  • WANG Weiming 4
Expand
  • 1. School of Geospatial Information, Information Engineering University, Zhengzhou 450052, China
  • 2. PLA Unit 61363, Xi'an 710054, China
  • 3. PLA Unit 61175, Nanjing 210049, China
  • 4. PLA Unit 61243, Urumqi 830000, China
* JIA Fenli, E-mail:

Received date: 2022-10-05

  Revised date: 2022-12-13

  Online published: 2024-03-26

Supported by

National Natural Science Foundation of China(42130112)

National Natural Science Foundation of China(41671407)

National Natural Science Foundation of China(41901335)

National Key Research and Development Program of China(2017YFB0503500)

摘要

视觉平衡是影响地图信息传输效果的重要因素之一。由于泛在制图的非专业性,泛在地图图像的视觉平衡效果往往取决于制图者自身美学素养的高低,不具有可控性。因此,迫切需要发展泛在地图图像的视觉平衡度计算方法。现有的地图视觉平衡度计算方法存在因子不全、判别结果主观依赖性强等问题。针对这些问题,本文提出了一种结合地图图像计算特征与专家评价知识的泛在地图图像视觉平衡度计算框架。通过丰富地图视觉密度影响因子,并引入概率模型学习专家对泛在地图图像的评价知识,实现对泛在地图图像视觉平衡度复杂分布的有效判别。本文以专家问卷的方式搜集了30名地图制图专家对1 730幅泛在地图图像的视觉平衡评价数据,构建了一个泛在地图图像视觉平衡度评价数据集。将计算得到的地图视觉平衡指标作为贝叶斯决策器的地图特征属性输入,将地图视觉平衡的专家评价数据作为贝叶斯决策器的分类结果,利用最小错误率贝叶斯决策方法对泛在地图图像的视觉平衡度进行判别,有效解决了人为主观判别地图视觉平衡度存在的不确定性问题。经实验验证,该框架在本文构建的泛在地图图像视觉平衡度评价数据集上能取得82.85%的评价准确率。

本文引用格式

徐晔秋 , 杨剑 , 贾奋励 , 杨磊 , 郭丽萍 , 王维明 . 一种基于多因子贝叶斯决策的泛在地图图像视觉平衡度计算框架[J]. 地球信息科学学报, 2024 , 26(1) : 184 -196 . DOI: 10.12082/dqxxkx.2024.220754

Abstract

Visual balance is one of the important factors that affect the effect of map information transmission. Due to the non-specialty of ubiquitous mapping, the visual balance of ubiquitous map images often depends on the cartographer's understanding of aesthetic quality, which can be unreliable. Therefore, it is necessary to develop a calculation method of visual balance index of ubiquitous map images. The existing methods for such purpose often fail to provide accurate and robust results due to use of incomplete factors and subjective parameter selection. To overcome such shortcomings, this paper proposes a framework to calculate the visual balance of ubiquitous map images by combining the computational features of map images and expert evaluation knowledge. It could effectively discriminate the complex distribution of visual balance index of ubiquitous map images by enriching the influence factors of visual density of the map and introducing the probabilistic model that learn expert evaluation knowledge for ubiquitous map images. To verify the proposed framework, we develop a visual balance benchmark dataset of ubiquitous map images by employing the evaluation data of 1730 ubiquitous map images from 30 cartographers by questionnaires investigation. The calculated map visual balance indexes are used as the map feature input of the Bayesian classification of visual balance, and the map evaluations are used as the classification results for model evaluation. And the rule of minimum error rate is used to optimize the performance of the classifier. Extensive experiments show that this calculation framework can achieve an accuracy of 82.85% in the evaluation dataset of visual balance index of ubiquitous map images constructed in our paper.

1 引言

视觉平衡是心理学、心理物理学以及艺术领域的重要研究内容[1]。对地图这一融科学与艺术为一体的产物[2]而言,视觉平衡是影响其科学性和艺术性的重要因素,是地图设计的重要关注点之一。在地图学中,视觉平衡是指地图布局中不同地图组成部分排列的视觉稳定性及其视觉冲击力[3],需要按照一定原则根据观察的客观对象的视觉变量给予其应有的地位,从而达到各要素的关系合理、协调,具有平衡感的视觉效果[4]。具备视觉平衡特点的地图,往往版面合理、层次分明且内容准确[5];各图面要素的配置既满足摆放灵活、多样统一、对称均衡的特点[6],使图面有“精神”,又不干扰地图主体[7];同时,相对重要的要素应出现在更加突出的位置,占据更大的“纸张”面积[3],这样能使地图读者更易于专注地图的内容。而不具备视觉平衡的地图,会使地图读者感到困惑或反感,只能获取到部分地图信息[3]
传统上地图均由经过培训的专业人员制作,遵循地图设计的一般规律。但随着泛在制图技术的发展,专业和非专业制图者均可借助网络平台和开源制图工具设计、制作、发布地图,且出于网络发布与传播便捷性考虑,多以图像形式在互联网上传输应用,本文将这类地图图像统称为泛在地图图像。从物理存储方式上来讲,泛在地图图像属于栅格电子地图的一种,但其呈现出来源广泛、表达多样、主题丰富的特点。同时,其存在的问题也非常突出,即并非所有都遵循制图规范,在符号、色彩、图面配置等设计方面水平参差不齐,使其作为一类地理信息资源的价值降低。特别是对于泛在地图图像的视觉平衡,往往取决于制图者自身美学素养的高低,成为影响信息传输效果的重要因素之一。因此,迫切需要发展能够定量计算泛在地图图像视觉平衡度的模型,对泛在地图图像进行视觉平衡评价,一方面可以过滤部分视觉平衡度较低的地图图像,把控检索质量;另一方面为评价泛在地图图像作为地理信息资源的美学价值提供参考。当前,地图学界对于地图的视觉平衡度计算模型已有一些研究成果[8],但总体还存在考虑因子简单、判别结果主观依赖性强等问题。本文瞄准上述问题,基于力矩平衡原理,构建一种基于多因子贝叶斯决策的泛在地图图像视觉平衡度定量计算框架。通过该框架对泛在地图图像的视觉平衡进行评价,有利于指导泛在制图过程中对于视觉平衡的把握,从而提高泛在地图图像的资源利用价值,促使泛在制图更符合地图设计规律。

2 视觉平衡评价研究现状

视觉平衡的概念,发端于艺术领域。格式塔心理学家Rudolf Arnheim奠定了视觉平衡的理论基础,他认为视觉平衡是空间构图的组织原则之一[9],构图通过视觉元素的排列创造出一个独立的、平衡的整体。每个视觉元素都具有感知重量(感知力)。具有感知重量的视觉元素包括位置、空间深度、尺寸、形状、颜色以及读者固有的兴趣等[10]。视觉平衡则是“构成视觉结构的感知力在二维空间中相互补偿的动力状态”[10]。视觉元素在作品中的排列决定了一幅画的平衡程度[11]。这些基本理论成为视觉平衡度计算方法的基础。
鉴于视觉平衡对地图信息传输效果具有重要影响,在地图设计领域,一些学者围绕地图视觉平衡的影响因素、影响模型及其度量计算开展了诸多有益探索。马俊等[8]总结了影响地图视觉平衡的因素,提出视觉平衡是由各个图形单元的视觉重量和视觉方向决定的,并提出了一种基于力矩平衡原理的视觉平衡度计算模型,实现了视觉平衡从定性评估到定量计算的转化。但是该方法选取的计算因子相对简单,如颜色并未将色彩对比因素考虑在内等。图1是采用不同的配色方案对同一份地图数据进行绘制的地图图像,可以清楚地看到其产生的视觉平衡感是不同的。右图相较于左图而言,由于其主图图面右下方区域的颜色与背景产生了强烈对比,导致整幅地图的视觉中心偏向于右下方。魏智威等[12]通过计算地图图面的视觉中心与理论视觉中心的距离,来判断地图视觉平衡的好坏,但是该方法只适用于计算地图主图的视觉平衡。徐建新等[13]针对地图图像,基于力矩平衡原理,采用图像处理领域的灰度分布均衡方法,提出了一种定量测度地图图像视觉平衡质量的新模型,但该方法忽略了形状因子的计算,并且对于颜色因子的量化采用图像的灰度值来进行代替,存在计算不够准确的问题。可见,目前虽有针对地图视觉平衡度计算模型的研究,但总体上较为零散,考虑的因子相对简单;对于定量计算结果如何转化为视觉平衡的结论,还存在主观性强的问题。
图1 采用不同色彩设计的地图对比(2020年江苏省各市GDP为例)

Fig. 1 Comparison of maps with different color design (GDP of various cities in Jiangsu Province in 2020)

视觉设计领域关于自动布局、用户界面评价的研究成果也对地图视觉平衡计算具有重要的参考价值。Yang[14]首次探索了机器理解视觉平衡的新方法,并提出视觉平衡是一种状态,在这种状态下,视觉权重被平均分布在页面上,视觉对象的各个视觉变量都会影响视觉权重的大小。Lok等[15]研究了自动布局的视觉平衡评价问题,定义了重量映射图(WeightMap)的概念和方法,提出视觉平衡可分为对称平衡、不对称平衡、径向平衡和晶体平衡四种类型,并针对晶体平衡构建了重量映射金字塔模型。Obrador[16]针对文档布局提出了一种兼顾色彩协调、视觉平衡以及图像质量的计算方法。 Zhou等[17]基于力矩平衡原理,提出了一种针对机架面板界面设计的视觉平衡度量方法,并建立了一个设计优化的评价模型。另外,随着人工智能技术的快速发展,智能算法也被应用于解决这个问题,Jahanian等[18]利用深度学习技术从大规模的图像数据集中学习视觉平衡,但是由于地图图像中的符号、文字等内容的颜色、纹理、尺度差别较大、质量各异,甚至存在相互重叠的情况,这可能导致依赖于地图图像数据的质量和数量的深度学习模型出现噪声较多的问题。以上方法针对图文布局领域的视觉平衡度进行量化计算,也为研究地图的视觉平衡扩展了思路。

3 泛在地图图像视觉平衡度计算框架

3.1 框架概述

Rudolf Arnheim[10]借用物理学中力的概念来描述艺术作品中不同视觉元素给人的主观感受,并指出平衡即为作品“势能”最小。因此,在构建地图的视觉平衡度计算模型时,多数借鉴了这一思想。地图通过图面主区和一组图面辅助元素来共同反映客观事物的位置、属性及事物间的关系。图面主区和各个图面辅助元素通过视觉变量及其组合产生视觉平衡的主观感受。对遵循设计规范的地图而言,其视觉平衡感受往往较为稳定,采用多因子定量描述的加权求和方法和地图样本视觉平衡度指标的算术平均的阈值设置方法能有效地计算和判别其视觉平衡度。
但是,泛在地图图像获取来源广泛、制图用途多样,既包括专业地图制图人员的成果,也包括大量由非专业制图人员设计的作品,其视觉平衡感受往往存在较大差异,采用上述方法无法有效处理不同视觉平衡度间存在重叠的复杂分布情况。针对这类问题,本文提出了一种结合地图图像计算特征与专家评价知识的泛在地图图像视觉平衡度计算框架(图2),通过丰富地图视觉密度影响因子,并引入概率模型学习专家对泛在地图图像的评价知识,实现对泛在地图图像视觉平衡度复杂分布的有效判别。
图2 泛在地图图像视觉平衡度计算框架

Fig. 2 Calculation framework of visual balance index of ubiquitous map images

该计算框架主要由地图图像预处理、视觉平衡度计算、专家问卷调查、贝叶斯决策4部分构成。
(1)地图图像预处理。首先使用互联网搜索引擎搜集地图图像,其次采用人工标注或特征自动提取[19]的方式,从地图图像中提取主图和图面辅助要素(即以多边形框选的形式,确定这些要素在图像上的位置范围及要素类别)获得主图和图面辅助要素的标签数据,最后对这些标签数据进行区域划分,便于下一步图像处理与指标计算。
(2)视觉平衡度计算。首先,基于地图图像预处理得到的结构化标签数据,采用图像处理技术提取其特征数据 X = [ x 1 , x 2 , , x n ] T,其中包括形状、位置、大小、颜色等特征。其次,确定地图图像视觉密度的影响因子及其定量描述方法,本文选取了颜色、形状、位置这3个因子,并对其进行多因子综合,得到地图图面配置的视觉密度值。最后,将上述特征数据和视觉密度值代入到设计好的地图图像视觉平衡度计算模型 U = f ρ i , S i , L i中进行计算。得到每幅地图图像的视觉平衡度指标 U l r U t b U
(3)专家问卷调查。为获得泛在地图图像的视觉平衡度指标对应的平衡度分布,以问卷调查的方式获得的专家对每幅地图的视觉平衡性评价数据,作为指导泛在地图图像视觉平衡度判别的统计先验。本文构建了泛在地图图像样本数据集,设计了视觉平衡度调查问卷,将泛在地图图像视觉平衡度分为平衡、难以区分、不平衡3类判别结果,依托互联网平台问卷工具开展相应的问卷调查,获取地图制图专家对泛在地图图像的视觉平衡度评价数据。
(4)贝叶斯决策。基于地图图像平衡度指标数据和相应的专家评价数据,通过参数估计构建一个反映泛在地图图像视觉平衡度真实分布的概率模型 y i = f x U , ω i,并应用该模型基于泛在地图视觉平衡度指标进行视觉平衡度判别。本文采用左右平衡指标 U l r、上下平衡指标 U t b和总体平衡指标 U作为视觉平衡度描述特征,专家评价数据作为判别真值,构建了最小错误率贝叶斯决策模型进行视觉平衡度的判别。
需要指出的是,上述计算框架虽基于泛在地图图像采用地图特征计算与专家评价知识结合的方式进行实现,但框架中的部分内容,如视觉平衡度指标的计算和基于贝叶斯决策的视觉平衡度判别可面向一般地图图像,并且可以根据地图数据特点和评价需求进行相应的改进与扩展。针对不同类型的地图数据资源可通过专家问卷的样本数据进行选择,从而应用于不同类型地图的视觉平衡度判别。本文后续三节将对该计算框架的基本设计与实现进行介绍。

3.2 地图图像视觉平衡度计算模型

地图图像的视觉平衡度评价本质上是评判地图主图和图面辅助要素的空间布局是否平衡,可通过设计一个视觉平衡度计算模型定量地反映地图图像的视觉平衡程度[16]。Zhou[17]提出了一个针对界面组合设计的视觉平衡优化模型,通过将一个界面分成4个区域,并分别计算其各自的视觉重量,然后计算出整个界面视觉平衡值,最后根据该值的大小对其界面进行优化,方法简单高效。本文针对地图图像的特点,在该模型的基础上,提出了一个基于力矩平衡的地图图像视觉平衡度计算模型,改进了原有模型的左右平衡指标和上下平衡指标的计算,同时做了归一化处理,更加清晰地观察到地图图像的视觉平衡偏重情况(式(1))。
  U = U l r 2 + U t b 2 2   U l r = V M R - V M L / m a x   ( V M L , V M R )   U t b = ( V M T - V M B ) / m a x   ( V M T , V M B )
式中: U为地图图像视觉平衡度的总体平衡指标; U l r为地图图像视觉平衡度的左右平衡指标, U t b为地图图像视觉平衡度的上下平衡指标; V M R V M L V M T V M B分别为地图图面左、右、上、下4个部分所包含图面配置要素的视觉重力矩之和; m a x   ( V M L / T , V M R / B )  为2个部分视觉重力矩的较大值。

3.2.1 视觉重力矩

使用上述模型计算地图图像视觉平衡度指标的重点在于计算出地图图像中各个主图和各个图面辅助要素的视觉重力矩值。本文沿用了文献[8]提出的视觉重力矩函数模型(式(2))。
  V G i = S i × ρ i   v m i = V G i × L i   V M j = i = 1 n v m i
式中: 1 i n V G i 为第 i个图面配置要素的视觉重量; S i为第 i个图面配置要素的面积; ρ i为第 i个图面配置要素的视觉密度;   L i 为地图的视觉中心到图面配置要素视觉中心的距离; v m i为第 i个图面配置要素的视觉重力矩; V M j为4个区域的视觉重力矩值。
在使用该模型计算地图图像各个区域的视觉重力矩时还需要确定的参数主要包括:图面配置要素的面积 S i、地图的视觉中心到各个图面配置要素视觉中心[20]的距离 L i 、视觉密度 ρ i。其中,视觉密度仅通过图像处理技术对地图图像进行数据提取并不能准确地将其计算出来。

3.2.2 视觉密度

在视觉设计领域中,视觉密度是指在一个单位面积或体积内满足视觉快感的程度和传达信息量的大小[21]。在地图设计中,视觉密度通常是指在地图图面上的要素因其颜色、形状、位置等视觉变量的不同而产生的不同视觉刺激,它的大小可视为各视觉变量的线性组合[8](式(3))。
ρ i = j = 1 n ω j × x j
式中: ρ i为第 i个图面配置要素的视觉密度; x j为第 j j=1,2,…,n)个视觉变量的量化值; ω j为第 j个视觉变量的权重,在本文中假设各视觉变量同等重要,权重取值相等。

3.3 视觉密度的影响因子及其量化方法

根据地图图像的特点,本文将视觉密度的影响因子锁定在颜色、位置、形状这3个影响因子上,下面分别对每个因子进行分析。

3.3.1 颜色因子

通常,色彩鲜明且与周围对比明显的要素更能引起人的注意[22],从而能够快速地捕捉和识别信息[12]。在地图设计时,设计者们为了更加突出和完善地表示与主题相关的一种或几种要素,使地图内容更加专题化、用途更加专门化,通常会强调色彩对比。因此,在对颜色因子进行量化时,不仅需要考虑颜色自身,还需要考虑颜色之间的对比关系。由于视觉密度与人的感知相关,本文选择CIELAB颜色空间的三分量作为颜色的描述因子。
色彩对比通常在邻域内或与背景的对比中产生[12]。在本文中,色彩对比根据地图图像的主图类型分情况进行计算。当主图区域覆盖整幅地图图像时,考虑该图面配置要素的颜色在局部邻域内的色彩对比,否则,只考虑与全局背景的色彩对比。下面分别介绍两者的量化方法。
对于在局部邻域内色彩对比的量化,采用基于层次的聚类算法对地图图像的颜色进行预提取,得到一个大致的聚类数目以及一个初始的聚类结果。而后将该聚类数目作为k均值聚类算法的参数k,再采用k均值聚类算法进一步改进聚类结果,得到各个颜色的RGB值及其聚类中心。最后将各个颜色与局部邻域内包含颜色的RGB值的平均值之差转换到对应的CIELAB颜色空间内(式(4)[23])。
Δ C = 2 + r - 256 × Δ R 2 + 4 × Δ G 2 + 2 + 255 - r - 256 × Δ B 2
式中: Δ C为颜色因子的量化值; r -为2种颜色在RGB颜色空间中R值的平均值; Δ R Δ G Δ B分别为2种颜色在RGB颜色空间中R、G、B值之差。
对于在全局背景下色彩对比的量化,采用图像处理技术获取整幅地图的RGB值,将出现次数最多的作为全局背景的颜色,而后采用与在局部邻域内色彩对比相同的方法进行计算。

3.3.2 位置因子

Rudolf Arnheim提出了一种结构网络图,成为视觉平衡研究的核心理论之一[18]。他假设任何视觉艺术品上都有5个热点(包括中心)并确定了它们的位置,如图3(a)所示。
图3 泛在地图图像位置划分

Fig. 3 The position division map of ubiquitous map image

地图图像不同于艺术作品,大多数读者在阅读地图时,其视觉注意力具有一定的方向性。一般情况下,是从左上方进入到右下方退出[8]。因此,这2个位置属于视觉上的重点,应给与较大的视觉权重[8]。本文借鉴该结构网络图,并结合地图图像的特点,将地图图面划分为5个区域,如图3(b)所示,在图中分别用不同的颜色对其划分区域进行了标注。同时,若图面配置要素的视觉中心点与该区域中心的距离越远,其视觉权重应该越小。因此,对于位置因子的量化,首先采用文献[8]中通过视觉密度问卷统计后的位置因子平均值作为各个区域中心的基础权重,其值依次为0.24、0.19、0.21、0.22、0.14;其次根据图面配置要素的视觉中心与各个区域中心的距离,判断该图面配置要素的区域归属情况;最后根据图面配置要素的视觉中心与距离所属区域中心的距离对其进行加权计算(式(5))。
L i = w n × l m a x - l l m a x
式中: L i为位置因子的量化值; 1 n 5,且n为整数;   w n为热点中心权重值; l为图面配置要素的视觉中心与距离最近的热点中心的距离, l m a x为其距离的最大值。

3.3.3 形状因子

经过对标签数据的统计发现,绝大多数地图图像的主图和图面辅助要素具有明显可区分的矩形或多边形边界,因此将地图图像的主图和图面辅助要素的形状分为规则几何轮廓和不规则几何轮廓。属于规则几何轮廓的形状主要为矩形,它的区别取决于自身的长宽比。因此,本文采用非圆性[24]来度量矩形在凸凹方面表现出来的复杂度。定义一个与矩形具有相同周长的圆为等效圆,用矩形面积与其等效圆面积差之比来进行量化(式(6))。
M = A A E
式中: M为矩形形状因子的量化值; A E为其等效圆的面积; A为矩形的面积。
属于不规则几何轮廓的形状主要为多边形,本文采用全局距离熵[25]进行量化(式(7))。
H = 1 n i = 1 n r i r m a x
式中: H为多边形形状因子的量化值; r i表示第 i个轮廓点到其质心的距离通过除以最大距离 r m a x得到的归一化距离, 1 i n

3.4 地图图像视觉平衡度贝叶斯决策

3.4.1 地图图像视觉平衡度判别

现有的地图图像视觉平衡度判别通常采用地图样本视觉平衡度指标的算术平均来设置阈值[8][13]。通过统计地图样本的视觉平衡度指标的算术平均值来确定判别阈值,然后将测试地图的视觉平衡度指标与其进行比较,结果直接作为地图图像视觉平衡度判别依据。这种抽样统计方法虽简单且易于实现,但是它假设地图视觉平衡是关于平衡度指标线性可分的,忽略了不同视觉平衡度判别结果分布之间存在重叠的复杂分布情况。
本文将地图图像视觉平衡度判别看作分类问题。为处理平衡度判别中难以确定的多因子影响关系、读图过程中存在的主观因素(知识结构、美学素养等)差异等造成的不确定性,引入贝叶斯决策方法对地图图像的视觉平衡度进行判别,利用概率模型学习专家评价知识,获取地图图像视觉平衡度的最优判别结果。

3.4.2 最小错误率贝叶斯决策

本文将地图图像的视觉平衡度分为平衡 ω 1、不平衡 ω 2和难以区分 ω 3 3类。采用最小错误率贝叶斯决策方法来实现地图图像视觉平衡度的判别,根据每幅地图图像计算得到的视觉平衡指标特征 x U = U , U l r , U t b T,来判断地图图像的视觉平衡度 y。在贝叶斯决策方法中,最小错误率决策就是尽量减少决策错误,即取后验概率最大的分类结果作为决策输出[26],其决策规则如式(8)。
y = ω i ,     P y = ω i | x U > P y = ω j | x U y = ω j ,     P y = ω i | x U P y = ω j | x U
式中: i , j 1,2 , 3   i j P y =   ω i | x U P y = ω j | x U分别为泛在地图图像视觉平衡度各类别的后验概率。
对于最小错误率贝叶斯决策的求解,已知一幅地图图像的视觉平衡特征 x U,通过比较其分类 y = ω i的后验概率,即可判定其类别。
首先,计算地图图像视觉平衡度各类别的先验概率的极大似然估计(式(9))。
p ^ y = ω k = i = 1 N I y i = ω k + λ N + K λ ,           k = 1,2 , , K
式中: I是指示性函数,若 y i = ω k,则 I y i = ω k = 1,否则 I y i = ω k = 0 λ是平滑项, λ = 1时则是拉普拉斯平滑,这里 λ = 1;在本文中,K为地图视觉平衡度的类别数,这里K=3; N为地图视觉平衡度类别 ω k的地图样本数。
其次,计算条件概率密度(式(10))。
p x U ( j ) = U j l | y = ω k = 1 2 π σ j k e U i l - μ j k 2 2 σ j k 2  
式中: x U ( j )为视觉平衡指标特征 x U的第j个特征, j=1,2,3; U j l为视觉平衡指标特征 x Uj个特征可能的取值; μ j k σ j k分别为高斯分布的均值和协方差,可用极大似然估计法进行估算。
最后,根据贝叶斯公式计算各类别的后验概率(式(11))。
P ω i x U = p x U ω i P ω i p x U                                   = p x U ω i P ω i j = 1 2 p x U ω i P ω i           ( i = 1,2 )
根据最小错误率贝叶斯决策准则,测试地图图像的视觉平衡度类别应判定为后验概率最大的类别,如图4所示。
图4 地图图像的最小错误率贝叶斯决策

Fig. 4 Minimum error rate Bayesian decision making for map images

图4中, P ω i   p x U ω i分别表示各类别已知的先验概率和类条件概率密度,通过贝叶斯公式可以计算得到各类别的后验概率,根据后验概率得到各类别的决策分界线 t i(图中红色虚线)。决策分界线 t i将x轴分为3个区域,分别对应各类别的决策区域。其中, P i e分别为其中一类被判为另一类的错误率, p ω 1 P 1 e则表示该类被判为另一类的平均错误率,即图中阴影部分所代表的区域。简而言之,若样本x落在分界线 t 1左侧则可判别为平衡,落在分界线 t 1 t 3之间则可判别为难以区分,落在分界线 t 3右侧则可判别为不平衡。

4 实验与分析

4.1 泛在地图图像视觉平衡度专家问卷调查

本文通过专家问卷调查构建了一个泛在地图图像视觉平衡评价数据集,为贝叶斯决策器提供地图图像视觉平衡度判别的先验数据。

4.1.1 泛在地图图像搜集与处理

由于地图的不同构图类型会直接影响其视觉平衡度的计算,并且当读者阅读地图时,不同构图类型也会对其在进行视觉平衡度判别时产生一定的影响。因此,本文利用互联网图像搜索引擎从新闻媒体、门户网站等数据源中根据地图的构图类型采集了1 773幅泛在地图图像,主要包括“环绕式”、“嵌套式”、“分割式”和“局部放大式”。然后采用多边形框对地图图面辅助要素(图名、图例、比例尺等)和主图进行人工标注,得到标签数据。其次,从处理结果中筛除了43幅存在图面配置要素标注内容有误或具有复合表达(多个并列主图区)的泛在地图图像。最后得到1 730幅地图作为实验数据。表1为不同构图类型的泛在地图图像示例。
表1 泛在地图图像的构图类型

Tab. 1 The composition type of ubiquitous map images

环绕式 嵌套式 分割式 局部放大式
例1
例2

4.1.2 专家问卷调查

由于地图视觉平衡度评价需要一定的专业知识,本文通过问卷调查的方式收集了长期从事地图设计、地图制图工作的专家对于样本地图的评价结果,进而结合因子计算,得出初步的评价方案,同时也为贝叶斯决策模型提供标签数据。
采用“问卷星”作为问卷调查工具,为减少设备对于实验结果的影响,实验在PC端与移动端同步开展。将构建的泛在地图图像数据集随机分为10组,每组包含173幅地图图像,分别对应10份问卷,图5为某份问卷在PC端和移动端的问卷示例。
图5 “问卷星”平台问卷示例

Fig. 5 Examples of "Questionnaire Star" platform questionnaire

在问卷设计时,按照5个评价等级(平衡、较平衡、不平衡、较不平衡、难以区分)进行了预备实验,发现被试在确定较平衡或较不平衡时,产生了明显的混淆情况,进而引发厌烦情绪。因此正式的问卷中对泛在地图图像的视觉平衡度一共设置了平衡、难以区分和不平衡3个评价等级。每份问卷中还包含一个说明,目的是减少因视觉平衡概念及其判定原则不明确而对实验结果产生影响。
本实验邀请了从事地图制图领域工作的专家30名,专家通过PC端互联网浏览器或手机移动端“问卷星”小程序参与实验。这30名专家被随机分成3个小组,每个小组10人,分别对应10份不同的问卷,确保每幅地图都能收集到3名专家评价。专家的评价结果以“投票”的形式进行综合,得到了每幅地图的视觉平衡度评价结果,如表2所示。
表2 专家评价结果统计

Tab. 2 Statistics of expert evaluation results

平衡程度 地图数量/幅 占比/%
平衡 1 327 76.7
难以区分 159 9.1
不平衡 244 14.1

4.2 实验结果

采用Python实现了泛在地图图像视觉平衡度指标计算与贝叶斯决策器,基于问卷调查获取的评价结果,构建了泛在地图图像视觉平衡度评价数据集。本节基于该数据集对视觉平衡度计算框架的有效性进行实验分析。
首先对1 730幅泛在地图图像的视觉平衡度指标进行计算,并绘制泛在地图图像视觉平衡度指标的统计分布图(图6)。其中,横轴表示泛在地图图像的视觉平衡度指标(U值)的10个取值区间,纵轴表示泛在地图图像的视觉平衡度指标(U值)在对应区间内的数量。由图6可见,符合视觉平衡的泛在地图图像样本的数量远多于其他两类,其U值主要分布在0~0.3内,总体呈现指数分布;平衡度为难以区分的地图图像的U值分布在0~0.5内,总体呈现均匀分布;而视觉不平衡的地图图像数量随着U值的增大而增大,在0.3~0.4达到峰值后随着U值增大而减小,总体呈现高斯分布。
图6 地图图像视觉平衡U值的统计分布

Fig. 6 Distribution of map images across U-values

用计算得到的地图平衡指标特征 X = { x U i } = { U , U l r , U t b i T },地图视觉平衡的专家评价数据 Ω = { ω i }构建贝叶斯决策器的训练与测试数据集。将1 730幅地图图像按照7:3进行划分, 70%用于贝叶斯决策器的训练, 30%用于测试。将数据代入模型后,得到的预测结果统计如表3所示。通过该贝叶斯决策器判别地图视觉平衡度的总体准确率为82.85%,判别地图视觉平衡度为平衡的准确率为93.97%,说明该决策器总体性能良好。但该决策器判别地图视觉平衡度为难以区分的准确率为0%,判别地图视觉平衡度为不平衡的准确率仅为76.71%,下面将对其具体原因进行分析。
表3 视觉平衡度判别结果统计

Tab. 3 The result statistics of visual balance discrimination

平衡程度 地图数量/幅 准确率/%
平衡 398 93.97
难以区分 48 0
不平衡 73 76.71
总体 519 82.85

4.3 实验分析

为进一步分析贝叶斯决策器对不同判别结果的性能差异,本文绘制了视觉平衡度判别混淆矩阵(图7)。在混淆矩阵中,主对角线的网格颜色越深,代表决策器的性能越好。在图7中,可以清楚的看到,颜色最深的一块网格代表的是视觉平衡度为平衡的泛在地图图像判别为平衡的准确率,这说明贝叶斯决策器能够非常准确地判别视觉平衡度为平衡的地图;而在主对角线上存在一块白色网格,该网格代表的是决策器将视觉平衡度为难以区分的泛在地图图像判别为难以区分的准确率为0%,通过观察其左右相邻的网格发现,决策器将视觉平衡度为难以区分的地图分别判别为平衡和不平衡的概率为58.33%和41.67%,分析其原因主要是因为判别泛在地图图像视觉平衡度为难以区分的视觉平衡U值的分布区间与平衡和不平衡重叠部分较多,从而导致决策器将泛在地图图像视觉平衡度为难以区分的泛在地图图像判别为其他类型。而另一块颜色较深的网格代表的是视觉平衡度为不平衡的泛在地图图像判别为不平衡的准确率为76.71%,这说明该决策器能较好地判别视觉平衡度为不平衡的泛在地图图像,但仍然存在一些判别混淆的情况。
图7 视觉平衡度判别混淆矩阵

注:矩阵单元格的数值表示决策器判别结果,上面数字为该类别的地图图像数量,下面数字为.其所占比例。

Fig. 7 Confusion matrix of the discrimination of visual balance

从判别结果中选取部分泛在地图图像进行分析(表4),进一步理解计算框架的适用性。表4第一列和第三列为决策器判别正确的泛在地图图像示例,从地图构图设计类型的角度出发,可以发现,该贝叶斯决策器对于构图设计类型为环绕式(第三列第一幅)和局部放大式(第一列第四幅)的泛在地图图像,能够准确地进行判别。表4第二列和第四列为决策器判别错误的地图示例,从中也可以看出,该决策器对于构图设计类型为嵌套式(第四列第三幅)和分割式(第二列第二幅)的地图,容易出现判别混淆的情况。通过查看这些判别出现错误的泛在地图图像的视觉平衡指标,发现其计算结果与通过直接观察得到的视觉感受还存在一些偏差,其主要原因是泛在地图图像的图面配置要素存在内部复杂度的不同,当一个图面配置要素的内部过于复杂时,也会引起人视觉重心的偏移。
表4 计算框架判别结果示例

Tab. 4 Sample results of the calculation framework

平衡判为平衡 平衡判为不平衡 不平衡判为不平衡 不平衡判为平衡
例1
例2
例3
例4

5 结论

泛在地图图像蕴含丰富的时空语义,但设计水平良莠不齐,限制了其研究与应用前景。视觉平衡度是地图视觉表达效果的重要影响因素,定量评价视觉平衡度,能够为泛在地图图像的检索、处理、应用提供评价参考。本文对此开展了研究,创新性体现在:
(1)提出了结合地图图像计算特征与专家评价知识的泛在地图图像视觉平衡度计算框架。通过丰富地图视觉密度影响因子,并引入概率模型学习专家对泛在地图图像的评价知识,实现对泛在地图图像视觉平衡度复杂分布的有效判别。该框架可推广至一般地图图像。
(2)基于力矩平衡原理,改进了地图图像视觉平衡度计算模型,在该模型中选取了颜色、形状、位置这3个视觉变量作为影响因子,优化与改进各因子的定量描述方法,较好地顾及了人的视觉感受以及实际读图体验。
[1]
Kandemir B, Zhou Z H, Li J, et al. Beyond saliency: Assessing visual balance with high-level cues[C]// Proceedings of the on Thematic Workshops of ACM Multimedia 2017. New York: ACM, 2017:26-34. DOI:10.1145/3126686.3126712

[2]
高俊. 地图学四面体——数字化时代地图学的诠释[J]. 测绘学报, 2004, 33(1):6-11.

[Gao J. Cartographic tetrahedron: Explanation of cartography in the digital era[J]. Acta Geodaetica et Cartographic Sinica, 2004, 33(1):6-11.] DOI:10.3321/j.issn.1001-1595.2004.01.002

[3]
Alexander (ed), Peter (ed). The Routledge Handbook of Mapping and Cartography[M]. London: Routledge, 2017, 315-318.

[4]
测绘学名词审定委员会. 测绘学名词-2020,2020[M]. 4版. 北京: 测绘出版社, 2020.

[Surveying and Mapping Terminology Examination and Approval Committee. Chinese terms in surveying and mapping[M]. 4th ed. Beijing: Sino Maps Press, 2020.]

[5]
曹一冰, 付洪贝, 潘志超. 地图设计中的美学研究[J]. 测绘与空间地理信息, 2011, 34(1):231-233.

[Cao Y B, Fu H B, Pan Z C. Aesthetic analysis in the map design[J]. Geomatics & Spatial Information Technology, 2011, 34(1):231-233.] DOI:10.3969/j.issn.1672-5867.2011.01.070

[6]
李晓珊. 专题地图整饰设计与表达[J]. 测绘, 2016, 39(5):231-233.

[ The design and expression of thematic map decoration[J]. Surveying and Mapping of Sichuan, 2016, 39(5):231-233.] DOI:10.3969/j.issn.1674-5019. 2016.05.011

[7]
程颉, 黄丽娜, 任福, 等. 兼顾整体协调和主题表达的地图集整饰设计[J]. 地理空间信息, 2021, 19(8):65-69,5.

[Cheng J, Huang L N, Ren F, et al. Atlas decoration design considering overall coordination and theme expression[J]. Geospatial Information, 2021, 19(8):65-69,5.] DOI: 10.3969/j.issn.1672-4623.2021.08.017

[8]
马俊, 王光霞, 崔秀飞, 等. 采用力矩平衡原理建立地图视觉平衡模型[J]. 武汉大学学报·信息科学版, 2013, 38(1):116-120.

[Ma J, Wang G X, Cui X F, et al. Using the principle of moment balance establishing map’s visual balance modle[J]. Geomatics and Information Science of Wuhan University, 2013, 38(1):116-120.] DOI:10.13203/j.whugis2013.01.028

[9]
Tyler C W. Some principles of spatial organization in art[J]. Spatial Vision, 2007, 20(6):509-530. DOI:10.1163/156856807782758377

PMID

[10]
Arnheim R. Art and visual perception: A psychology of the creative eye[M]. New version, expanded and rev. ed.ed. Berkeley: University of California Press, 1974: 219-221.

[11]
Vartanian O, Martindale C, Podsiadlo J, et al. The link between composition and balance in masterworks vs. paintings of lower artistic quality[J]. British Journal of Psychology, 2005, 96(4):493-503. DOI:10.1348/000712605X47927

[12]
魏智威, 郭庆胜, 颜芬, 等. 顾及视觉规律的行政区划图自动着色回溯法[J]. 测绘学报, 2018, 47(3):396-402.

DOI

[Wei Z W, Guo Q S, Yan F, et al. Backtracking method of coloring administrative maps considering visual perception rules[J]. Acta Geodaetica et Cartographica Sinica, 2018, 47(3):396-402.] DOI:10.11947/j.AGCS.2018.20170148

[13]
徐建新, 张晶, 张彦霞, 等. 地图图像视觉平衡质量的定量测度模型[J]. 测绘科学, 2018, 43(7):38-43.

[Xu J X, Zhang J, Zhang Y X, et al. The quantitative model of visual balance quality based on map image[J]. Science of Surveying and Mapping, 2018, 43(7):38-43.] DOI:10.16251/j.cnki.1009-2307.2018.07.006

[14]
Yang X. Visual balance--the tightrope of computer generated layout[D]. Massachusetts Institute of Technology, 1995, 8-12.

[15]
Lok S, Feiner S, Ngai G. Evaluation of visual balance for automated layout[C]// Proceedings of the 9th international conference on Intelligent user interfaces. New York: ACM, 2004:101-108. DOI:10.1145/964442.964462

[16]
Obrador P. Document layout and color driven image retrieval[C]// Proceedings of the 30th annual international ACM SIGIR conference on Research and development in information retrieval. New York: ACM, 2007:889-890. DOI:10.1145/1277741.1277960

[17]
Zhou L, Xue C Q, Tomimatsu K. Research of interface composition design optimization based on visual balance[M]//Advances in Intelligent Systems and Computing. Berlin, Heidelberg: Springer Berlin Heidelberg, 2014:483-493. DOI:10.1007/978-3-642-54927-4_46

[18]
Jahanian A, Vishwanathan S N, Allebach J P. Learning visual balance from large-scale datasets of aesthetically highly rated images[C]// Proc SPIE 9394, Human Vision and Electronic Imaging XX, 2015,9394:326-334. DOI: 10.1117/12.2084548

[19]
Poco J, Heer J. Reverse-engineering visualizations: Recovering visual encodings from chart images[J]. Computer Graphics Forum, 2017, 36(3):353-363. DOI:10.1111/cgf.13193

[20]
魏嘉. 专题地图图面要素自动配置方法的研究[D]. 武汉: 武汉大学, 2018.

[Wei J. Study on the method of automatic thematic map layout[D]. Wuhan: Wuhan University, 2018.]

[21]
武晓. 重庆市城市中心区沿街建筑外立面广告视觉密度阈值研究[D]. 重庆: 重庆大学, 2012.

[Wu X. Research on visual density threshold of the facade advertisement along the street in Chongqing urban center[D]. Chongqing: Chongqing University, 2012.]

[22]
贾奋励, 田江鹏, 智梅霞, 等. 虚拟地理试验的地标视觉显著度模型[J]. 测绘学报, 2018, 47(8):1114-1122.

DOI

[Jia F L, Tian J P, Zhi M X, et al. A visual salience model of landmark based on virtual geographical experiments[J]. Acta Geodaetica et Cartographica Sinica, 2018, 47(8):1114-1122.] DOI:10.11947/j.AGCS.2018.20180107

[23]
Riemersma T, Colour metric[M/OL]. CompuPhase, 2019-05-23. https://www.compuphase.com/cmetric.htm.

[24]
戴凌宸, 张佳婧, 彭韧, 等. 图标形状复杂度的计算度量[J]. 计算机辅助设计与图形学学报, 2017, 29(10):1786-1793.

[Dai L C, Zhang J J, Peng R, et al. Computational evaluation of logo shape complexities[J]. Journal of Computer-Aided Design & Computer Graphics, 2017, 29(10):1786-1793.] DOI:10.3969/j.issn.1003-9775.2017.10.003

[25]
Chen Y P, Sundaram H. Estimating complexity of 2D shapes[C]// 2005 IEEE 7th Workshop on Multimedia Signal Processing. IEEE, 2006:1-4. DOI:10.1109/MMSP.2005.248668

[26]
张学工, 汪小我. 模式识别:模式识别与机器学习[M]. 4版. 北京: 清华大学出版社, 2021.

[Zhang X G, Wang X W. Pattern recognition[M]. 4th ed. Beijing: Tsinghua University Press, 2021.]

文章导航

/