全球旧事资料 分类
模式识别实验报告
西安交通大学高海南
《模式识别》实验报告
最小错误率贝叶斯决策分类
一、实验原理
对于具有多个特征参数的样本(如本实验的iris数据样本有d4个参数),
其正态分布的概率密度函数可定义为
px
1
d
22
1
2
exp

12
x

μ1
x

μT

式中,xx1x2xd是d维行向量,μ12d是d维行向量,是dd
维协方差矩阵,1是的逆矩阵,是的行列式。本实验我们采用最小错误率的贝叶斯决策,使用如下的函数作为判别函数gixpxiPii123(3个类别)
其中Pi为类别i发生的先验概率,pxi为类别i的类条件概率密度函数。
由其判决规则,如果使gixgjx对一切ji成立,则将x归为i类。
我们根据假设:类别i,i12……N的类条件概率密度函数pxi,
i12……N服从正态分布,即有pxiNμii,那么上式就可以写为
gix

Pi
d
22
12
exp
12
xμ1xμT



i123
对上式右端取对数,可得
gi
x


12
x

μi
i1
x

μi
T

l

Pi


12
l

i
dl
22
上式中的第二项与样本所属类别无关,将其从判别函数中消去,不会改变分类结
果。则判别函数gix可简化为以下形式
gi
x


12
x

μi
i1x

μi
T

l

Pi

12
l

i
1
f模式识别实验报告
西安交通大学高海南
二、实验步骤
(1)从Iristxt文件中读取估计参数用的样本,每一类样本抽出前40个,分别求其均值,公式如下
μi1
xi
Nixi
i123
clear原始数据导入irisloadCMATLAB7work模式识别iristxtN40每组取N40个样本
求第一类样本均值fori1N
forj14w1ijirisij1
e
de
dsumx1sumw11fori14
mea
x11isumx11iNe
d
求第二类样本均值
fori1Nforj14w2ijirisi50j1e
d
e
dsumx2sumw21fori14
mea
x21isumx21iNe
d
求第三类样本均值
fori1Nforj14w3ijirisi100j1e
d
e
dsumx3sumw31fori14
mea
x31isumx31iNe
d
(2)求每一类样本的协方差矩阵、逆矩阵i1以及协方差矩阵的行列式i,协方差矩阵计算公式如下
ijk

1Ni1
Nil1
xlj


ij

xlk

ik

jk1234
其中xlj代表i类的第l个样本,第j个特征值;
ij
代表i
类的
N
i
个样品第
j
个特征的平均值
xlk代表i类的第l个样品,第k个特征值;
2
f模式识别实验报告
西安交通大学高海南
wik
代表i
类的
N
i
个样品第
k
个特征的平均值。
求第一类样本协方差矩阵
z1440var1440fori14
forj14fork1N
z1ijz1ijw1kimea
x11iw1kr
好听全球资料 返回顶部