归方法是一种消除自变量多重共线性的有效方法,从某
种意义说,PLS回归方法是改进了的主成分PCR方法,但是又不同于PCR方
法,PLS在成分提取的过程中不仅考虑自变量(解释变量)的信息,同时考虑
了因变量(被解释变量)的信息,在复杂的多变量系统中,PLS方法没有对逐
个变量判断其留取与舍弃,而利用信息分解的思路,将自变量系统中的信息重
新组合,有效地提取对系统解释性最强的综合变量,排除重叠信息或无解释意
义的信息干扰,从而克服变量多重共线性在系统建模中的不良作用,得到一个
更为可靠的分析结果。PLS回归方法有单因变量的PLS回归与多因变量的
PLS回归,由于研究的问题只涉及到单因变量,因此只就单因变量的PLS回归
作阐述。
(一)单因变量PLS回归方法建模思路设因变量Y和p
个自变量构成的自变量集合Xx1,…,xp,为了研究因变量与自变量
之间的统计关系,我们观测了
个样本点,由此构成了
维的因变量向量和自
由变量构成的
×p的观测矩阵Xx1,…,xp
×p。PLS回归方法
f是首先在矩阵X中提取成分t1(t1为x1…xp的线性组合),要
求t1应可能大的携带X中的变异信息,且与Y的相关程度最大,这样,
t1尽可能好地综合了X的信息,同时对Y又能最强的解释能力,在第一个成
分t1被提取后,PLS回归分析实施X对t1的回归及Y对t1的回归,
如果回归方程已经达到满意的精度,则算法终止;否则,将利用X被t1解
释后的残余信息进行第二轮的成分提取,如此反复迭代,直到能达到一个较满
意的精度为止,若最终对X共提取了k个成分t1,…,tk,PLS回归将
通过实施Y对t1,…,tk的回归,然后表达成Y关于原变量
x1,…,xp的回归方程。
(二)PLS回归方法建模步骤1°
将X与Y进行标准化处理,得到标准化后的自变量矩阵E0和因变量矩阵
F0附图
(三)PLS成分数的确定在前面的分析中指出,
PLS回归分析往往只需提取前面k个成分t1,…,tk就可以得到一个稳
定和可靠的模型,对于PLS成分数如何来确定,既要保证所提取的成分对系统
解释能力最强,又要克服变量之间的多重共成性关系,我们采用国外广泛应用
的交互检验CVCrossValidatio
方法来确定。交互检验是先构造统计量
预测误差平方和PRESSPredictio
ResidualErrorSumofSquares,然后
求使其达到最小的成分数k即为所求。关于PRESS的构造:把所有
个样本
点分成两部分,第一部分是除去某个样本点i的所有样本点集合,用这部分样
本点并使用kr