全球旧事资料 分类
在主成分分析中,
对于单张数据表X,为了找到能最好地概括原数据的综合变量,在X中提取了第一主成分F1使得F1中所包含的原数据变异信息可达到最大,即
VarF1→max在典型相关分析中,为了从整体上研究两个数据表之间的相关关系,分别在X和Y中提取了典型成分F1和G1,它们满足
rF1G1→maxF1TF11G1TG11
在能够达到相关度最大的综合变量F1和G1之间,如果存在明显的相关关系,则可以认为,在两个数据表之间亦存在相关关系。
提取成分的做法在数据分析的方法中十分常见,除主成分、典型成分以外,常见到的还有Fisher判别法中的判别成分。实际上,如果F是X数据表的某种成分,则意味着F是X中变量的某一线性组合FXa而F作为一个综合变量,它在X中所综合提取的信息,将满足我们特殊的分析需要。22偏最小二乘回归分析的建模方法
设有q个因变量y1…yq和p个自变量x1…xp为了研究因变量与自变量的统计关系,观测
个样本点,由此构成了自变量与因变量的数据表X【x1…xp】
p和Y【y1…yq】。
q偏最小二乘法回归分别在X与Y中提取出t1和u1也就是说,t1是x1…xp的线性组合,u1是y1…yq的线性组合。在提取这两个成分时,为了回归分析的需要,有下列两个要求:(1)t1和u1应尽可能大地携带它们各自数据表中的变异信息(2)t1和u1的相关程度能达到最大
这两个要求表明,t1和u1应尽可能好地代表数据表X和Y,同时自变量的成分t1对因变量的成分u1又有最强的解释能力。
在第一个成分t1和u1被提取后,偏最小二乘法回归分别实施X对t1的回归以及Y对t1的回归。如果方程达到了满意的精度,则算法终止;否则,将利用X被t1解释后的残余信息以及Y被t1解释后的残余信息进行第二轮的成分提取。如此递推,直到能达到一个较为满意的精度为止。若最终对X共提取了m个成分t1…tm,偏最小二乘法回归将通过实施YK
文案大全
f实用标准
对t1…tm的回归,然后再表达成YK关于原变量x1…xp的回归方程,k1…q。
3计算方法推导
31普遍采用的计算推导过程
为了数学推导方便起见,首先将数据做标准化处理。X经标准化处理后的数据矩阵记为
E0E01…E0P
pY经过标准化处理后的数据矩阵记为F0F01…F0q
q。第一步,记t1是E0的第一个成分,t1E0w1w1是E0的第一个轴,它是一个单位向量,即
w11;记u1是F0的第一个成分,u1F0c1c1是F0的第一个轴,它是一个单位向量,即c11。如果要t1u1能分别很好德代表X与Y中的数据变异信息,根据主成分分析原理,r
好听全球资料 返回顶部