一是确定图像特征的位置或区域;其二是确定该特征的描述算子,经常用数学中的向量来表示。正常的邮件图像与垃圾图像是存在某些差异的,表示两类图像的特征模式也应有明显的区分。
a
正常图像
b垃圾图像
图1正常邮件图像和垃圾邮件图像
作者简介:马力1990,女,辽宁沈阳人,通信工程专业本科生
f论文下面分别对梯度特征、颜色特征及LBP特征进行分析和说明。11梯度特征一般可利用Sobel算子来计算图像的梯度。图像fxy在xy点处的梯度可表示为:
fxyGxGyTffTxy
12
1
颜色特征垃圾邮件图像由于嵌入了某些信息,通常其颜色分布较单一。利用这一特点可以将部分垃圾图像和正常图像区分开来。图4分别给出了图1a和b的颜色直方图。通过对比看出,正常图像的颜色分布较为均匀且丰富,相反垃圾邮件图像的颜色直方图仅仅分布在其中的几种颜色上,变化剧烈。
005
梯度向量的模值定义为
2212fxyGxGy
不同颜色所占比例
2
004
为了提高图像特征的提取速度,可以简化近似为fxymaxGxGy3或4将归一化的直方图作为图像的特征向量,图3给出了图1a和b的梯度直方图。可以看出,正常邮件图像的梯度直方图分布较均匀,灰度变化缓慢,而垃圾邮件图像的灰度变化剧烈,而且分布较单一且比较集中。
0016
003
002
fxyGxGy
001
0100
0
100颜色维数
200
300
a正常图像的颜色直方图
01201
不同颜色所占比例
0014
不同灰度级所占比例
008006004002
0012001000800060004000201000100灰度级200300
0100
0
100颜色维数
200
300
b垃圾图像的颜色直方图图4正常邮件图像和垃圾邮件图像的颜色直方图对比a正常邮件图像的梯度直方图
13
008007
不同灰度级所占比例
00600500400300200101000100灰度级200300
b正常邮件图像的梯度直方图图3正常邮件图像和垃圾邮件图像的梯度直方图
LBP特征局部二值模式LBPlocalbi
arypatter
是表示图像局部纹理特征的一种算子5,它计算复杂度相对较低并且效果比较好,因此常常将它用于图像的分类和识别6。131LBP的定义起初LBP算子的定义是在邻域窗口内,通常选择3×3的窗口,将窗口中心像素的灰度值作为基准,分别与其邻域的8个像素的灰度值进行比较。如果中心像素的灰度值大于邻域,那么此时邻域像素点的位置记为0,否则记为1,依次比较后可以得到一个8位二进制数,再将此转化为十进制数,用这个值来反映该区域的纹理信息。图5给出了一
fr