全球旧事资料 分类
,即VarY1≥VarY2≥…≥VarYp
4总方差不增不减,即VarY1VarY2…VarYpVarx1Varx2…Varxp
这一性质说明:主成分是原变量的线性组合,是对原变量信息的一种改组,主成分不增加总信息量,也不减少总信息量。
5主成分和原变量的相关系数CorrYi,xjaijVarYiaiji6令X1,X2,…,Xp的相关矩阵为Rai1,ai2,…,aip则是相关矩阵R的第i个特征向量eige
vector。而且,特征值i就是第i主成分的方差,即
VarYii
其中i为相关矩阵R的第i个特征值eige
value
1≥2≥…≥p≥0
3、主成分的数目的选取前已指出,设有p个随机变量,便有p个主成分。由于总方差不增不减,Y1,
Y2等前几个综合变量的方差较大而Yp,Yp1等后几个综合变量的方差较小严格说来,只有前几个综合变量才称得上主要成份,后几个综合变量实为“次”要成份。实践中总是保留前几个,忽略后几个。
保留多少个主成分取决于保留部分的累积方差在方差总和中所占百分比即累计贡献率,它标志着前几个主成分概括信息之多寡。实践中,粗略规定一个百分比(一般为80)便可决定保留几个主成分;如果多留一个主成分,累积方差增加无几,便不再多留。
四、主成分分析的一般步骤
1、设观察个体的变量指标为x1,x2,…,xp,它们的综合指标主成分为z1,z2,…,zm(m≤p),则

z1l11x1l12x2


zm

lm1x1
lm2x2

l1pxplmpxp
fz1,z2,…,zm分别称为原变量指标x1,x2,…,x6的第一,第二,…,第m主成分。
2.收集原始数据,得如下数据表:
观察个体
x1
x2
Xp
个体1
个体2
个体
设有随机变量x1,x2,…,xp,其样本均数记为x1,x2,…,xp,样本标准差记为S1,S2,…,Sp。首先作标准化变换
xXXS
3、计算相关系数矩阵,对应的特征值1
征向量
p按从大到小排列及其对应的特
Matlab命令:1RcorrcoefX
2bceigsR
4.计算主成分贡献率及累计贡献率
f类似形式结果:
5.计算主成分载荷
lijieijij126
eij为i对应的标准化的特征向量的第j分量
类似形式结果:
6.进行结果分析类似形式:▲第一主成分z1与x1,x3,x4,x5,x8,x9有较大的正相关,可以看作是流域盆地规模的代表;▲第二主成分z2与x2有较大的正相关,与x7有较大的负相关,分可以看作是流域侵蚀状况的代表;
f▲第三主成分z3与x6有较大的正相关,可以看作是河系形态的代表;▲根据主成分载荷,该流域系统的9项要素可以被归纳为三类,即流域盆地的规模,流域侵蚀状r
好听全球资料 返回顶部