相关影响。在选取评价指标时,消除了指标之间的相关影响,因此更容易选择指标。而且实践证明指标之间相关程度越高,主成分分析效果越好。
(3)在综合评价函数中,主成分的权数为各个主成分的贡献率,反映了该主成分包含原始数据的信息量占全部信息量的比重,这样确定地权数比较客观、合理,克服了某些评价方法中人为确定权数的缺陷。
(4)主成分分析的计算方法比较规范,便于在计算机上实现。
主成分分析方法的不足主要体现在两个方面:
(1)所得到的主成分实际含义模糊,没有原始数据的含义确切、清楚。
(2)主成分分析方法只考虑了数据的二阶统计量(自相关),这对于高斯分布是足够的,但对于非高斯分布,由于高级统计量中含有附加的信息,因此PCA对其表示不够充分。
f龙源期刊网httpwwwqika
comc
PCA方法算法比较简单,且具有一定的局限性。因此,越来越多的研究都集中在PCA和其它方法如LDA、Kmea
s方法、核函数、SVM、粗糙集、专家模型、GMM等方法相结合的应用,并取得了很好的效果。
4主成分分析的应用(Applicatio
ofPCA)
主成分分析主要应用是评价排序、特征提取、图像处理、图像分类、模式识别、图像压缩等方面。下面将综述PCA的主要应用范例。
(1)评价排序
现实生活中人们经常要对事物进行评价和排序,但事物本身往往是由多元数据构成,且数据之间具有某些内在的联系。使用PCA进行数据处理,可以去除数据之间的相关性,又减少了工作量。在文献6中,作者介绍了一种基于PCA的教学质量评价方法,该方法消除了文中所确定的16个教学质量评价指标之间的相关性,将原来的16个指标简化为5个主成分,对这5个主成分的载荷进行分析,进而评价课堂教学质量。实验结果证明,主成分分析所得的结果与实际资料反映的情况相符,详细内容见参考文献6。
现在,越来越多的基于PCA的评价方法正不断地应用于各个领域,比如文化符号归因分析、软件质量评价、性能评估、可持续发展评价、城市交通拥挤评价、风险评价等。这些方法中,PCA都被用于降低维数并去除数据之间的相关性。评价指标的选取、层次权重如何分配是此类问题的研究重点。随着大数据时代到来,PCA在该领域将会有更加广泛的应用。
(2)特征提取
在特征提取领域应用最为广泛、提取特征效果较好的就是PCA方法。该方法提取了事物的主要特征元素,同时达到了降维的目的,简化了复杂模型。在文献7中,作者提出了一种基于多重组合特征提取算法(PCACFEA)的文本分类方法,首先用正交变换将文本空r