技术文章 > 地理信息系统可视化专题制图要素分级探讨

地理信息系统可视化专题制图要素分级探讨

2017-12-12 04:50

文档管理软件,文档管理系统,知识管理系统,档案管理系统的技术资料:

党安荣
  提 要 本文以地理信息系统(GIS)可视化效果为目标,以制图信息理论为指导,根据专题地图分级表示方法的特点,在分级定量标准和分级方法两个方面,探讨了GIS可视化专题制图要素的分级问题。文章首先确定以地图分级信息量来测度GIS可视化效果,在通用地图综合信息量计算公式的基础上,拟定了计算“制图要素分级信息量”的新公式;并针对现有数列、级数分级方法的不足,提出了“分段数列、级数分级”方法。然后,以新公式为分级定量标准和寻优目标,应用分段数列、级数分级方法进行了试验研究;并与传统分级定量标准和分级方法进行对比分析。结果表明,本文所获取的优化分级方案具有较好的可视化效果。
  关键词 地理信息系统 可视化 专题制图 定量标准 分级方法 分级信息量
STUDY ON THEMATIC MAPPING ELEMENT
CLASSIFICATION OF GIS VISUALIZATION
Dang Anrong
(GIS Lab. of Architecture College, Tsinghua University, Beijing 100084)
  Key words GIS, visualization, thematic mapping, quantitative standard, classification method, classification mapping information content
  Abstract A series of classification quantitative standard have been worked out since the research of G.F.Jecks and M.R.C.Coulson (1963). However, the characteristics of statistical data has been considered so much that the mapping effect of classification scheme was hardly cared. In 1980s, mapping information content based on the entropy function was used to evaluate classification scheme which took the statistical precision and mapping effect into account at the same time. This article uses mapping classification information content to determine the visualization effect of GIS. A new formula of calculating classification information content is worked out based on the general mapping information concept.
  Using one of the general formulas of numerical sequence and progression, lots of classification schemes can be acquired with many sets of parameters (x,d,γ,Bk) values within their domain. This is the basic condition for classification optimization. However, the class intervals or class breaks of classification scheme changing in a single regularity from the minimum value to the maximum value of mapping element. And the change regularity of mapping element data itself are not always so simple. The real situations are different from one to another and as complex as several types of changing rules composed together. Author proposes a new idea of “partial numerical sequence and progression classification method”. The idea of this new method is that dividing mapping elements data series into several subseries at first; and then, using different classification method to acquire classification scheme for each subseries; finally, generalizing all of the subseries classification schemes to determine the final optimal classification scheme.
  可视化(Visualization)是地理信息系统(GIS)的一个重要的理论和技术问题,专题地图是地理信息系统可视化的主要形式之一,分级表示法则是常用的专题地图表示方法。应用分级表示方法的关键是如何确定专题制图要素的分级方案,分级方案的优劣、直接关系着地理信息传输的科学性,决定着GIS的可视化效果。因此,如何获取优化的专题制图要素分级方案,便成为GIS可视化的基本问题之一;而要获得优化的分级方案,必须运用科学的分级定量标准和合理的分级方法。三十多年来,国内外诸多学者在分级定量标准和分级方法两个方面,进行了大量的试验研究,取得了丰硕的成果[1~12]。但是,随着GIS的普及与应用、随着GIS理论与技术的发展,GIS的可视化问题日益突出,现有的分级定量标准和分级方法已不能满足要求。本文拟在前人研究的基础上,就分级定量标准与分级方法进行探讨。
1 分级定量标准的探讨
  对于分级定量标准的研究,可以划分为两个系列:系列之一是从制图要素数值的统计意义出发,以分级精度或分级误差作为分级定量标准[1~8],这是比较传统和经典的一类;系列之二是在地图信息理论和地图传输理论指导下,以测度地图信息量为分级定量标准[9~12],起步于八十年代。从Jenks和Coulson提出以精度测试作为衡量分级的定量标准至今的几十年中,制图学家研究出大量分级精度和分级误差统计量,先后有D[1]、TAI[2]、[6]、SARF[6]、F[7]、ACU[4]、ACA[8]等分级定量标准及其计算公式问世,从中可以看出地图学界对分级问题认识的不断深入。虽然上述众多形式的统计量各不相同,但均属于系列之一,都是从专题制图要素本身的数值出发,力争使分级方案能较好地反映数值的统计特征,而对分级方案的制图效果考虑不够,更没有与GIS的可视化问题相联系。相比之下,地图信息量的测度则始终以制图要素信息的表达与传输为目标,更注重制图要素的可视化制图效果;因而,八十年代以来,逐渐被制图学界所采纳。
  起初,人们多直接应用信息论中著名的申农公式,通过概率统计方法来计算地图信息量:
  (1-1)
式中 I为地图信息量;Pi为制图要素i占整个制图要素的比例。
  后来,根据制图要素的“多样性”,又提出了一些综合的方法:
  (1-2)
式中 i、j、k、Δ为各类制图要素;n、li、mj、rk为各类制图要素的多种特征数;γi,j,k,Δ为各类制图要素以及制图要素的多种特征占整个制图要素的比例。
  显然,上述方法并不能概括种类繁多的制图要素,亦即无法将地图上丰富的信息量全部加以描述,甚至其计算结果还与制图学原则有悖。为此,文献[11]提出了计算地图信息量的“综合特征值量测法”,即任一制图要素的信息量,都用该要素的特征值的信息量之积来表示:
  (1-3)
式中 μ为制图要素的特征值参数,其数值计算随点状符号、线状符号及面状符号有所区别;α为制图要素特征数值,通常包括要素的个数、分级、复杂程度和重要程度四个特征;ωi为制图要素第i分级或第i类别出现的频率或频数。
  应用该方法量测的地图综合信息量,能够较全面而科学地描述制图信息的传输;但此方法并不能完全反映分级表示方法的特殊性,不能直接作为制图要素分级的定量标准。为此,本文根据专题制图要素分级表示方法的特点和GIS的可视化要求,对公式(1-3)进行改造,形成公式(1-4)所列的新型分级定量标准——“制图要素分级信息量”:

  (1-4)
式中 γ为制图比例尺加权因子;f(k)为要素分级数加权因子;k为制图要素实际分级数;Sj为第j级制图要素面积;M为专题地图比例尺分母;N为要素最大理论分级数。
  上述各变量中,制图要素最大理论分级数N,是一个与专题地图表现形式和人的视觉变量模拟能力相关的变量;有关研究表明:通常,对于一般用图者而言,单色地图的最大理论分级数可取5~7级,而彩色地图则可达8~11级。
  从公式(1-4)可知,专题制图要素分级信息量与制图比例尺、要素分级数和各级制图面积有关。在同一级制图比例尺范围内,比例尺越大,分级信息量越大,可视化效果越好;在最大理论分级数以内,分级信息量随分级数增加而增大,可视化效果增强;相反,在最大理论分级数以外,分级信息量随分级数增大而减小,可视化效果减弱;分级区域面积分布越合理,分级信息量越大,可视化效果越好。这完全符合制图学原则,并从理论上定性地说明了新型分级定量标准的优点,具体效果则有待下文的实际应用和定量检验。
2 传统分级方法的改进
  制图要素的分级方法,一直是制图学界关注的问题之一。六十年代以前,制图人员一般仅从具体问题出发,在分级数确定的前提下,借助某一种数列或级数来获取规则的分级界限或分级间隔;七十年代以后,随着计算机的广泛应用,制图学者纷纷将大量数学方法引用到制图要素的分级中,取得了很大进展[4~10]。然而,传统的数列、级数分级方法,由于其所产生的分级界限有规律地变化,而且应用领域较广,从总体上仍具有其它方法无与伦比的优势。特别是文献[4]对传统的数列级数公式进行了创造性扩展,形成了数列、级数分级的通用公式:
  (1)任意数列分级法
  (2-1)
  (2)算术级数分级法
  (2-2)
  (3)几何级数分级法
  (2-3)
  (4)任意级数分级法
  (2-4)
式中 L、H分别是制图要素统计数据的最小值、最大值;Ai为制图要素分级界限(i=1,2,3,…,k+1);Bj为制图要素分级间隔(j=1,2,3…,k);χ、d、γ、Bk为待定分级参数。
  借助上述通用公式,任取一组参数(χ、d、γ、Bk),便可确定一个分级方案;如果在参数定义域范围内连续取值,可得到大量分级方案,这是获取优化分级方案的基本前提。
  制图实践表明,在大多数情况下,制图要素数值的变化具有多种曲线的复合特征,即在一定数值范围内表现出算术级数规律,而在另一数值范围则呈现任意数列特征,如此等等;更有复杂者,则包含多种交替的变化过程。
  鉴于上述问题的存在,本文对传统的数列、级数分级方法进行改进,提出“分段数列、级数分级”的构想。该方法的基本思想是:根据GIS专题制图要素本身的数值分布规律,将其数值变化全序列划分成若干子序列,使每个子序列呈现单一的变化规律;以某种最适宜的数列或级数对每一子序列进行分级,确定各子序列的分级界限或分级间隔;连接各子序列分级结果,形成制图要素全序列优化分级方案。具体步骤是:① 将制图要素数值按升序从小到大进行排序;② 绘制全序列数值变化散点图或变化曲线图;③ 依据散点图或曲线图所呈现的规律划分子序列;④ 按地图表现形式确定总体分级数和局部分级数;⑤ 分别确定各子序列的局部优化分级方案;⑥ 综合子序列分级形成全局优化分级方案。
  上述分析不难看出,改进后的“分段数列、级数分级”方法,通过一系列具体措施,可以克服现有分级方法的不足,下文的应用试验与对比分析也证实了这一点。
3 应用试验与对比分析
  本文利用陕西省渭北地区乡级行政区划空间数据和人口密度统计数据,以输出1∶50万人口密度图为例,应用本文所提出的新型分级定量标准和分段数列、级数分级方法,来获取优化分级方案;并选择统计分级定量标准和传统数列、级数分级方法为参照,进行了三项对比分析,具体过程和结果如下。
3.1 新型分级定量标准与统计分级定量标准的对比
  在传统数列、级数分级方法支持下,首先分别以“分级信息量”和“分级精度(ACA)”为目标函数,通过200次Monte Carlo寻优,获得两个优化分级方案;然后分别计算两个分级方案的分级信息量和分级精度(表1)。从表1可以看出,以制图要素分级信息量为定量标准所获得的优化分级方案,同样具有较高的分级精度;相反,以分级精度为定量标准所获取的优化分级方案,其分级信息量则不是很高。
表1 新型分级定量标准应用对比
Tab.1 Application and comparison on new
classification quantitative standard
分级定量标准
分级方法 分级信息量

分段数列、级数法 传统数列、级数法
分级信息量 1 106.45 1 047.42
分级精度 0.752 327 0.759 180
3.2 分段数列级数分级方法与传统数列级数分级方法的对比
  以“分级精度”为目标函数,首先分别应用“分段数列、级数分级法”和“传统数列、级数分级法”,通过200次Monte Carlo寻优,获得两个优化分级方案;然后分别计算两个分级方案的分级信息量和分级精度(表2)。对比表2所列数据可以看出,分段数列、级数分级法所获取的优化分级方案,同时具有较高的分级统计精度和分级信息量;而以传统数列、级数分级法获取的优化分级方案则不然。
表2 新型分级方法的应用与对比
Tab.2 Application and comparison on new
classification method
分级定量标准
分级方法 分级精度

分段数列、级数法 传统数列、级数法
分级信息量 1 109.83 1 047.42
分级精度 0.760 023 0.759 180
3.3 新型分级定量标准与分级方法同时与传统方法的对比
  以“分级信息量”为目标函数,首先分别应用“分段数列、级数分级法”和“传统数列级数分级法”,通过200次Monte Carlo寻优,获得两个优化分级方案;然后分别计算两个分级方案的分级信息量和分级精度(表3)。结果表明,如果在应用分段数列、级数分级法的同时,以制图要素分级信息量作为定量标准,可获得具有更高分级统计精度和更大分级信息量的优化分级方案。
表3 新型分级定量标准与分级方法应用对比
Tab.3 Application and comparison on new
quantitative standard & classification method
分级定量标准
分级方法 分级信息量

分段数列、级数法 传统数列、级数法
分级信息量 1 114.38 1 106.45
分级精度 0.762 281 0.752 327
4 结语
  本文以GIS的可视化为目标,从GIS的主要表现形式之一——专题地图的分级表示方法入手,用制图要素分级信息量来测度GIS可视化效果,对分级定量标准和分级方法进行了理论研究和应用分析,结果表明:以制图要素分级信息量为分级定量标准、应用分段数列、级数分级方法,可以使GIS的专题地图具有较好的可视化效果。
作者简介;党安荣,男,一九六四年生于陕西佳县。一九八五年毕业于陕西师范大学地理系,获“地理学”学士学位;一九八八年获西北大学“地图学与遥感”专业硕士学位,同年分配到“煤炭部航测遥感局计算中心”从事GIS与CAD工作;一九九七年获中国科学院遥感应用研究所“地图学与地理信息系统”专业博士学位,目前在清华大学建筑学院“城市规划与设计”博士后流动站工作,主要从事基于RS和GIS的城市总体规划研究。已在《遥感学报》、《地理科学》、《中国图象图形学报》、《测绘通报》、《环境遥感》、《中国煤田地质》等专业刊物及ICA、FIG、ISPRS和CPGIS等国际会议上发表论文30余篇。专长于RS与GIS的应用研究、GIS成果的图形表达等。
作者单位:党安荣 (清华大学建筑学院GIS实验室,北京 100084)
参考文献(References)
 1 Jenks G F, Coulson M R C. Class Intervals for Statistical Maps. Internationally Yearbook of Cartography, 1963. 119~134.
 2 Jenks G F, Caspall F C. Error on choropleth maps: definition, measurement, reduction. Annals of the Association of American Geographers, 1971, 61∶217~244.
 3 Lu Xiaozhong. A study on the general principle and quantitative standard of statistical map classification. Military Survey Science, 1987(1)∶10~17. (In Chinese) [陆效中. 统计地图分级的一般原则与定量标准的探讨. 军测科技, 1987(1)∶10~17.]
 4 Lu Xiaozhong. Optimal statistical map classification method with mathematical regularity. Selections of Military Survey Science, 1988(1)∶31~36. (In Chinese) [陆效中. 具有数学规则的最优统计地图分级法. 军测科技文选, 1988(1)∶31~36.]
 5 Dang Anrong. A New Way of Obtaining Optimal Classification Scheme Automatically. Proceedings of 14th International Cartographic Conference, Budapest, Hungary, August, 1989.
 6 Robison A H, Sale R, Morrison J. Elements of Cartography. 5th ed. New York: John Wiley & Sons Pub., 1984.
 7 Dent B D. Principles of Thematic Map Design. London: Addison Wesley, 1985.
 8 Dang Anrong. An approach to the general principle and quantitative standard of population density classification. Scientia Geographica Sinica, 1990(3)∶264~270. (In Chinese) [党安荣. 人口密度分级的一般原则与定量标准的探讨. 地理科学, 1990(3)∶264~270.]
 9 Zhu Guorui. Determining topographic elevation table by measuring classification information amount. Cartography, 1986(2)∶5~8. (In Chinese) [祝国瑞. 用测度信息量的方法确定地貌高度表. 地图, 1986(2)∶5~8.]
 10 Yang Xiangheng, Dang Anrong. Application of the method of measuring information amount by entropy function to the hierarchy table of population density. Bulletin of Surveying and Mapping, 1988(2)∶35~38. (In Chinese) [杨相恒, 党安荣. 应用熵函数测度信息量的方法检验人口密度分级表. 测绘通报, 1988(2)∶35~38.]
 11 Ou Weijun, Yao Xianlin. Measuring of cartographic information amount: a general eigenvalue measuring method. Cartography, 1988(4)∶3~7. (In Chinese) [偶卫军, 姚贤林. 地图信息量的测度——综合特征值量测法. 地图, 1988(4)∶3~7.]
 12 Dang Anrong. Acquiring Optimal Classification Scheme by Measuring Comprehensive Mapping Information Content. Proceedings of FIG(16th), Sydney, Australia, March, 1994.