全球旧事资料 分类
主成分分析方法及matlab运用解释
主成分分析方法
在许多实际问题中多个变量之间就是具有一定的相关关系的。因此我们就会很自然地想到能否在各个变量之间相关关系研究的基础上用较少的新变量代替原来较多的变量而且使这些较少的新变量尽可能多地保留原来较多的变量所反映的信息?事实上这种想法就是可以实现的这里介绍的主成分分析方法就就是综合处理这种问题的一种强有力的方法。
一、主成分分析的基本原理
主成分分析就是把原来多个变量化为少数几个综合指标的一种统计分析方法从数学角度来瞧这就是一种降维处理技术。假定有
个地理样本每个样本共有p个变量描述这样就构成了一个
×p阶的地理数据矩阵
x11x12Lx1p
X


x21
L
x22L
LL
x2pL
x
1x
2Lx
p1
如何从这么多变量的数据中抓住地理事物的内在规律性呢?要解决这一问题自
然要在p维空间中加以考察这就是比较麻烦的。为了克服这一困难就需要进行
降维处理即用较少的几个综合指标来代替原来较多的变量指标而且使这些较少
的综合指标既能尽量多地反映原来较多指标所反映的信息同时它们之间又就是
彼此独立的。那么这些综合指标即新变量应如何选取呢?显然其最简单的形
式就就是取原来变量指标的线性组合适当调整组合系数使新的变量指标之间相
互独立且代表性最好。
如果记原来的变量指标为x1x2…xp它们的综合指标新变量指标为z1z2…zmm≤p。则
z1l11x1l12x2Ll1pxp

z2
l21x1l22x2L
l2pxp


zmlm1x1lm2x2Llmpxp2
在2式中系数lij由下列原则来决定1zi与zji≠jij12…m相互无关2z1就是x1x2…xp的一切线性组合中方差最大者z2就是与z1不相关的x1x2…xp的所有线性组合中方差最大者……zm就是与z1z2……zm1都不相关的x1x2…xp的所有线性组合中方差最大者。这样决定的新变量指标z1z2…zm分别称为原变量指标x1x2…xp的第一第二…第m主成分。其中z1在总方差中占的比例最大z2z3…zm的方差依次递减。在实际问题的分析中常挑选前几个最大的主成分这样既减少了变量的数目又抓住了主要矛盾简化了变量之间的关系。从以上分析可以瞧出找主成分就就是确定原来变量xjj12…p在诸主成分zii12…m上的载荷liji12…mj12…p从数学上容易知道它们分别就是x1x2…xp的相关矩阵的m个较大的特征值所对应的特征向量。二、主成分分析的计算步骤
通过上述主成分分析的基本原理的介绍我们可以把主成r
好听全球资料 返回顶部