191025397
11
0
20
17
5
1796231017522
0
0
18
18
5
11
1141E8
17
0
21
19
3
19
1218E8
14
7
20
3
f20
3
10
1515E8
19
16
23
21
4
5
1868E8
0
18
25
22
1
2
2597E8
15
0
27
23
3
22
2667E8
20
13
26
24
9
13
3113E8
0
0
25
25
4
9
3780E8
21
24
26
26
3
4
1133E9
23
25
27
27
1
3
3450E9
22
26
0
表4所列各项的意义如下:阶聚类步骤号;群集组合在某步中合并的个案;系数距离或相似系数;首次出现阶群集新生成聚类;下一阶对应步骤生成的新类将在第几步与其它个案或新类合并。从中可以看出聚类的进度和类详细合并的步骤。可以从表中看出,第12和第18个样本最先进行了聚类,样本间的距离为3568152164。表5显示的是聚类后的集群成员:
表5群集成员
案例
群集
1北京
1
2天津
1
3山西
2
4内蒙古
3
5辽宁
3
6吉林
2
7黑龙江
2
8上海
1
9江苏
3
10安徽
2
11福建
3
12江西
2
13山东
3
4
f14河南
2
15湖北
2
16湖南
2
17广东
3
18广西
2
19海南
2
20重庆
2
21四川
2
22贵州
2
23云南
2
24西藏
2
25陕西
2
26甘肃
2
27青海
2
28宁夏
2
从表5可以看到系统聚类分析的最终结果为:北京市、天津市、上海市属于第一类,内蒙古、辽宁省、江苏省、福建省、山东省、广东省被分为第三类,其他省、直辖市、自治区被分为第二类。
图1为垂直冰柱图,形状类似于冬天屋檐上垂下的冰柱,因此得名。横轴:案例(Case)表示被聚类的对象;纵轴:群集数(Numberofclusters)表示被聚成几类;图1以冰柱图表示聚类分析结果。图中第1列为聚类步骤号,第1行为样本及样本号。图中每一列代表一个冰柱,深色柱代表冰柱的长短。从冰柱的长短变化可以看出聚类的全过程。即如果样本或新类在第
步合并,则在图中第
步以上合并项对应列中用深色填充,没有空格。由于冰柱图是按照聚类的编号进行排列,所以其与聚结表的顺序刚好相反,也就是说聚结表的第一步对应于冰柱图的最后一步。冰柱图一般从表格的最后一行开始观察。最后一行中,类的数目为27,即聚积成27类,其中样本江西和广西用深色柱连接在一起,表示成两个样本聚成一类,其余每个样本构成一类。因此从冰柱图中可以非常清楚地看到,聚成
时类时,各个样本的类归属情况。
5
f图1冰柱图
图2为聚类分析之后的树状图:
图2树状图
图2清晰地表示出了聚类的全过程。它将实际的距离按比例调整到0-25
6
f的范围内,用逐级连线的方式连接性质相近的个案和新类,直至并为一类。在该图上部的距离标尺上r