全球旧事资料 分类

d2
ij
1
NiNj
NNijk1l1
XkiXljT
XkiXlj
有了距离度量之后,我们就可以在此基础上定义可分性测度了。一般来讲,当各个类别的类内距离越小时可分性越强,而类间距离越大时,可分性越强。因此可以有以各类样本之间的平均距离作为判据:
Jd
X
1MP2i1
i
M
Pj
j1
d
ij
JdX所反映的主要还是类别之间的分离程度,对类内的聚集程度反映不够。通常我
们采用跟一般的矩阵形式来构造可分性判据。1类内散度矩阵
设有M个类别,1LM,i类样本集X1iX2iLXNii,i类的散度矩
阵定义为:
Swi

1Ni
Nik1
Xkimi
XkimiT
f总的类内散度矩阵为:
M
SwPi
i1
M
SwiPi
i1
1NiNik1
Xkimi
XkimiT
2类间散度矩阵
第i个类别和第j个类别之间的散度矩阵定义为:
S
ij
B


mimj
mimjT
总的类间散度矩阵可以定义为:
SB
12
M
P
i1
i
M
Pj
j1
S
ij
B


12
Mi1
P
i
M
Pi
j1
mimj
mimj
M
令:m为总体均值,mPimi,则有:i1
M
SBPi
mim
mimT
i1
3总体散度矩阵总体散度矩阵可以定义为:
ST

1N
N
Xl
l1
mXl
mT
M
其中N为总的样本数,NNi。可以证明:STSWSB。i1
可以看出三个散度矩阵均为实对称矩阵。
上面我们所定义的判据:JdXJdXtrSTtrSWSB。tr表示取一个矩
N
阵的迹,也就是主对角线元素之和,N维方阵的迹为:traiii1
同样我们可以利用三个散度矩阵定义出一系列的可分性判据:
J1trSW1SB
J2
SBSW
J3

trSBtrSW

J4
STSW
f其中Α表示方阵Α的行列式的值,比较常用的判据是J1。
基于几何距离的可分性判据计算起来比较简单,只要我们已知各个类别的训练样本集,就可以计算出三个散度矩阵,同时也就可以计算出各种可分性判据。
二、基于概率分布的可分性判据基于几何距离的可分性判据计算起来比较简单,然而它没有考虑各类别的概率分布,因
此与识别错误率之间的联系却不是很紧密。下面介绍一种直接基于概率分布的可分性判据。先以最简单的一维特征、两类问题为例,下图表示了两种极端情况:
第一种情况是两类完全可分:对所有pX10的点,有pX20;第二种情况是两类完全不可分:对所有的X有pX1pX2。
下面我们可以定义两个类条件概率密度函数之间的距离JP作为交叠程度的度量,JP应
该满足如下条件:
1非负性,JP0;
2当两类完全重叠时JP取最大值,即若对所有X有pX20时,pX10,则JPmax;
3当两类密度函数完全相同时,JP应为零,即若pX2pX1,则JP0r
好听全球资料 返回顶部