全球旧事资料 分类
百度文库让每个人平等地提升自我
基于MATLAB的手写体数字识别算法的实现与分析


手写体数字识别是利用计算机自动辨认手写体阿拉伯数字的一种技术,是光
学字符识别技术的一个分支。手写体数字识别在邮政编码、财务报表、银行票据、
各种凭证以及调查表格的识别等等方面有着重要应用,由于数字识别经常涉及财
会、金融领域,其严格性更是不言而喻的。所以,对识别系统的可靠性和识别率
要求很高,构成了手写体数字识别面临的主要困难,大批量数据处理对系统速度
又有相当高的要求。
本文基于MNIST数据集,通过Matlab平台,对决策树算法、SVM算法和人
工神经网络(ANN)算法进行实现,并对分类算法的准确率进行评估。实验结果
表明,人工神经网络(ANN)的准确率最高,为9969,SVM算法次之,准确率
为9453,决策树算法的准确率为8353。三种分类算法中,决策树算法的速
度最快,SVM算法的速度最慢。另外,针对每一种分类算法在MNIST数据集上
的实验结果,本文还得出以下结论:
第一,MNIST数据集的归一化与否对决策树的分类效果几乎没有影响;对
SVM的分类效果影响较大,未归一化时的准确率为1135,归一化之后的准确
率为9453;对人工神经网络的分类效果影响较小,未归一化时的准确率为
8211,归一化之后的准确率为9969。这说明三种分类算法对数据的不平衡
分布的敏感程度各不相同。
第二,对于SVM分类算法,当训练数据集的样本容量小于60000(MNIST训
练数据集的最大样本容量)时,该算法对测试数据集分类预测的准确率随样本容
量的增大而增大。
第三,针对人工神经网络,数据类标签的表示形式对分类预测的准确率的影
响较大。使用10位数据表示类标签是的准确率为9969,远远高于使用1位数
据表示类标签时的准确率6024。
关键词:手写体数字识别;决策树算法;SVM算法;人工神经网络算法
I
f百度文库让每个人平等地提升自我
ABSTRACT
Ha
dwritte
umeralrecog
itio
isatech
iquethatusescomputertorecog
ize
ha
dwritte
Arabic
umeralsautomaticallya
disabra
chofopticalcharacter
recog
itio
tech
ologyHa
dwritte
umeralrecog
itio
hasimporta
tapplicatio
s
i
postalcodesfi
a
cialstateme
tsba
k
otesvariouski
dsofvouchersa
dthe
ide
tificatio
ofsurveyformsSi
cedigitalide
tificatio
ofte
i
volvesaccou
ti
ga
d
fi
a
ceitsstrict
essisselfevide
tThedema
dforide
tificatio
systemofthe
reliabilitya
drecog
itio
rateisveryhighco
stituti
gaha
dwritte
digital
ide
tificatio
faci
gmajordifficultieshighvolumedataprocessi
go
thesystem
speeda
daveryhighdema
d
I
thispaperweuseMatlabr
好听全球资料 返回顶部