全球旧事资料 分类
为M维的新特征矢量T
YTX。
这种方法是利用相关矩阵XR进行变换同样也可以利用协方差矩阵XC进行变换还可以利用样本的散度矩阵WSBSTS或者1
WBSS进行变换。过程都是一样的需要计算特征值和特征向量选择最大的M个特征值对应的特征矢量作出变换矩阵。
5实验设计和结果分析
基于特征相关性的特征选择算法选择c均值聚类算法来去除冗余。
C均值算法的基本思想即是通过迭代寻找c个聚类的一种划分方案使得用这c个聚类的均值来代表相应各类样本时所得到的总体误差最小。
C均值算法的基础是最小误差平方和准则。若iN是第i聚类iΓ中的样本数目
im是这些样本的均值即∑Γ∈
i
yi
iyNm1
把i
Γ
中的各样本y与均值im间的误差平方和对所有类相加后为
2
1e∑∑Γ∈c
iyii
myJ
eJ是误差平方和聚类准则它是样本集y和类别集Ω的函数。
C均值算法的步骤
1选择初始划分并计算每个聚类的均值以及误差平方和
2选择一个备选样本y设yiΓ∈
fX1
thefirstresultsofkmea
s
X2
X3
X1
X2
X3
1无论在聚类时初始均值如何选取在程序结果中总能得到相同的分类结果同时eJ的结果相差很小。
2当各聚类设定的初始均值不同时程序结果经过的步骤不同。
3eJ是随着聚类数目的增加而单调的减少的当聚类数目等于样本数时eJ0即每个样本自己成一类。
4此算法是个局部搜索算法并不能保证收敛到全局最优解即不能保证找到所有可能的聚类划分中误差平方和最小的解。算法的结果受到初始划分和样本调整顺序的影响。
6结论
模式识别技术是人工智能的基础技术21世纪是智能化、信息化、计算花、网络化的世纪在这个以数字计算为特征的世纪里模式识别技术将会获得巨大的发展空间。
特征选择作为数据预处理的一个必要步骤是模式识别中的一个关键问题。一个模式识别系统的成败首先取决于所利用的特征是否较好的反映了将要研究的分类问题。而且高维数据是特征选择的一个挑战研究人员总是努力的寻找着各种方法来尽量提高特征选择的性能。对于特征选择与特征提取还有许多问题期待解决高维数据的特征选择特别是训练样本较少而特征维数极高的数据集在样本的类别数未知的情况下设计时间复杂度较低的非监督的特征选择如何在进行特征选择时选择有意义的训练样本将维数约简与距离度量学习相结合随着特征选择的应用领域不断扩大当出现新的非线性相关的数据类型时如何设计新的特征选择算法将特征选择算法应用于人脸识别与人脸检测中消除传统人脸识别方法如PCA和LDA固有的局限性。
f模式识别是一门理r
好听全球资料 返回顶部