况和流域河系形态。如果选取其中相关系数绝对值最大者作为代表,则流域面积、流域盆地出口的海拔高度和分叉率可作为这三类要素的代表。
例2、主成分分析方法应用实例1实例1流域系统的主成分分析(张超,1984)表351(点击显示该表)给出了某流域系统57个流域盆地的9项变量指标。其中,x1代表流域盆地总高度(m),x2代表流域盆地山口的海拔高度(m),x3代表流域盆地周长(m),x4代表河道总长度(m),x5代表河道总数,x6代表平均分叉率,x7代表河谷最大坡度(度),x8代表河源数,x9代表流域盆地面积(km2)。
注:表中数据详见书本87和88页。1分析过程:①将表351中的原始数据作标准化处理,然后将它们代入相关系数公式计算,得到相关系数矩阵(表352)。
f②由相关系数矩阵计算特征值,以及各个主成分的贡献率与累计贡献率(见表353)。由表353可知,第一,第二,第三主成分的累计贡献率已高达865,故只需求出第一、第二、第三主成分z1,z2,z3即可。
z3上的载荷
f(表354)。
2结果分析:▲第一主成分z1与x1,x3,x4,x5,x8,x9有较大的正相关,可以看作是流域盆地规模的代表;▲第二主成分z2与x2有较大的正相关,与x7有较大的负相关,分可以看作是流域侵蚀状况的代表;▲第三主成分z3与x6有较大的正相关,可以看作是河系形态的代表;▲根据主成分载荷,该流域系统的9项要素可以被归纳为三类,即流域盆地的规模,流域侵蚀状况和流域河系形态。如果选取其中相关系数绝对值最大者作为代表,则流域面积、流域盆地出口的海拔高度和分叉率可作为这三类要素的代表。2实例之二:中国大陆31个省(市、区)第三产业综合发展水平的主成分分析与评估
f聚类分析
聚类分析就是用数学方法对事物进行分类,如(1)我们可以根据学校的师资、设备、学生的情况,将大学分成一流大学,二流大学等;(2)国家之间根据其发展水平可以划分为发达国家、发展中国家;环境优劣分类等。聚类分析一种多元统计方法。
基本思想:(1)确定观察个体的观测指标,找出能够度量相似程度的统计量;(2)建立相似关系矩阵R。(3)把一些相似程度较大的样品(或指标)聚合为一类,把另外一些彼此之间相似程度较大的样品(或指标)又聚合为另一类,关系密切的聚合到一个小的分类单位,关系疏远的聚合到一个大的分类单位,直到把所有的样品(或指标)聚合完毕。(4)分类结果可以用聚类谱系图表现,非常清楚直观。
fr