主成分分析就是将多项指标转化为少数几项综合指标用综合指标来解释多变量的方差协方差结构综合指标即为主成分。所得出的少数几个主成分要尽可能多地保留原始变量的信息,且彼此不相关因子分析是研究如何以最少的信息丢失将众多原始变量浓缩成少数几个因子变量以及如何使因子变量具有较强的可解释性的一种多元统计分析方法聚类分析是依据实验数据本身所具有的定性或定量的特征来对大量的数据进行分组归类以了解数据集的内在结构,并且对每一个数据集进行描述的过程。其主要依据是聚到同一个数据集中的样本应该彼此相似而属于不同组的样本应该足够不相似。三种分析方法既有区别也有联系,本文力图将三者的异同进行比较并举例说明三者在实际应用中的联系以期为更好地利用这些高级统计方法为研究所用有所裨益二、基本思想的异同(一共同点主成分分析法和因子分析法都是用少数的几个变量因子来综合反映原始变量(因子)的主要信息变量虽然较原始变量少,但所包含的信息量却占原始信息的85%以上所以即使用少数的几个新变量,可信度也很高,也可以有效地解释问题。并且新的变量彼此间互不相关消除了多重共线性这两种分析法得出的新变量,并不是原始变量筛选后剩余的变量。在主成分分析中最终确定的新变量是原始变量的线性组合如原始变量为x1x2。。x3经过坐标变换将原有的p个相关变量xi作线性变换,每个主成分都是由原有p个变量线性组合得到。在诸多主成分Zi中Z1在方差中占的比重最大说明它综合原有变量的能力最强越往后主成分在方差中的比重也小,综合原信息的能力越弱因子分析是要利用少数几个公共因子去解释较多个要观测变量中存在的复杂关系,它不是对原始变量的重新组合而是对原始变量进行分解,分解为公共因子与特殊因子两部分公共因子是由所有变量共同具有的少数几个因子;特殊因子是每个原始变量独自具有的因子对新产生的主成分变量及因子变量计算其得分,就可以将主成分得分或因子得分代替原始变量进行进一步的分析因为主成分变量及因子变量比原始变量少了许多所以起到了降维的作用为我们处理数据降低了难度聚类分析的基本思想是采用多变量的统计值,定量地确定相互之间的亲疏关系,考虑对象多因素的联系和主导作用按它们亲疏差异程度,归入不同的分类中一元,使分类更具客观实际并能反映事物
f的内在必然联系。也就是说,聚类分析是把研究对象视作多维空间中的许多点,并合理地分成若干类,r