两个要求表明,t1和u1应尽可能好的代表数据表X和Y同时自变量的成分t1对因变量的成分u1又有最强的解释能力。在第一个成分t1和u1被提取后,偏最小二乘回归分别实施X对t1的回归以及Y对u1的回归。如果回归方程已经达到满意的精度,则算法终止;否则将利用X被t1解释后的残余信息以及Y被t1解释后的残余信息进行第二轮的成分提取。如此往复,直到能达到一个较满意的精度为止。若最终对X共提取了m个成分t1,…,tm,偏最小二乘回归将通过实施yk对t1,…,tm,的
回归然后再表达成yk关于原变量x1,…,xm,的回归方程k12…q。
12计算方法推导为了数学推导方便起见首先将数据做标准化处理。X经标准化处理后的数
据矩阵记为E0E01,…,E0p
p,Yj经标准化处理后的数据矩阵记为
F0F01,…,F0q
p。
第一步记t1是E0的第一个成分,w1是E0的第一个轴,它是一个单位向量,
既w11。
ccc记u1是F0的第一个成分,u1F0
1。
1
是F0的第一个轴,并且
1。
1
3
f如果要t1,u1能分别很好的代表X与Y中的数据变异信息,根据主成分分析原理,应该有
Varu1max
Vart1max
另一方面,由于回归建模的需要,又要求t1对u1有很大的解释能力,有典型相关
分析的思路,t1与u1的相关度应达到最大值,既
r(t1,u1)max
因此,综合起来,在偏最小二乘回归中,我们要求t1与u1的协方差达到最大,既
Covt1,u1Vart1Varu1rt1,u1max
正规的数学表述应该是求解下列优化问题,既
maxw1c1
E0w1F0c1
st
ww
cc
1
11
1
11
cwc因此,将在w121和
21的约束条件下,去求
1
EF
1
00
的最大
1
值。
如果采用拉格朗日算法,记
wcwccEs1
F
00
1-
1
1
w1-1-
211-1
c对s分别求关于w1,1,
和
1
的偏导并令之为零,有
2
cEs
w1
F
00
1-21w10
12
cFs
c1
0
E0
w1
-2
2
0
1
13
ws-
1
1
w1-10
14
4
fccs--10
2
11
由式1215可以推出
15
21
22
w
1
E
0
F0
c1
E0w1F0c1
记1
21
22
w
1
E
0
F0
c1
所以
1
正是优化问题的目标函数值
把式12和式13写成
E0F0c11w1
16
F0E0w11c1
17将式17代入式16有
18同理可得
E0F0F0E0w112w1
F0E0E0F0c112c1
19
可见w1是矩阵E0F0F0E0的特征向量对应的特征值为121是目标函数值它要求取最大值所以w1是对应于E0F0F0E0矩阵最大特征值的单位特征向量而另
一方面c1是对应于矩阵F0r