全球旧事资料 分类
均匀光照增大了索书号图像的灰度值变化范围。2褪色程度的不同则降低了字符与背景的对比度。3污迹的影响。上述因素的存在不仅使得确定二值化过程中合理的阈值非常困难而且会改变索书号字符的形状特征最终影响连通域滤波的性能。
第三阶段索书号字符切分是将索书号字符串切分成一个个字符以提供给识别算法进行识别。单字切分的结果如何将直接影响识别结果而且切分好坏除字符能否正确识别之外没有较
好的判别依据。因此单字切分往往与字符识别紧密结合在一起。
索书号的单字切分可以分为两种情况非粘连单字切分和粘连字符的单字切分。非粘连单字
切分比价容易解决。但质量较差索书号图像二值化处理后相邻字符可能会发生粘连。而粘连索
书号切分存在的主要问题是1粘连字符的切分比较困难2索书号字符发生粘连有一部分是字符
的笔画发生变形所致如笔划宽度变粗等。即使正确的切分也不一定能够完全修正笔画的变形
即无法通过粘连切分恢复字符的原形。
第四阶段索书号单字识别。印刷体单字识别的研究已经相当成熟只是与其他应用领域的文字识别相比索书号文字的质量较差存在字符不均匀褪色笔划残缺以及大面积污迹等问题
f2索书号文字图像分割
复杂背景图像中的文字定位和分割是从图像中获取文字信息的关键步骤直接影响到后续文字识别的准确性它在机器人视觉汽车牌照自动识别计算机文本自动输入邮件地址自动识别集装箱编号自动识别以及视频图像内容的检索等系统中都有广泛的应用。CCD拍摄的图书索书号图像如图21所示图像中除了索书号还包含尤其他文字红色条形框还包含有其他文字红色条形框以及装饰景物等为了能够正确识别该书的索书号首先必须从图像中正确分割出索书号图像。
图21图书索书号图像
但是从图像尤其场景图像中自动定位和分割文字是比较困难的其主要原因有以下几个方面第一文字嵌入在图像中并与其它图形共存如边框商标装饰物以及污点等第二由于文字颜色退化文字颜色不均匀热切背景颜色有食欲吻脖子颜色差异很小第三文字尺寸大小变化第四关照条件无法控制广州不均匀第五索书号文字与其他文字。
本课题利用基于边缘点数量统计的文字图像分割方法。根据图书馆索书号的制定规则索书号文字图像具有如下特征第一索书号文字采用黑色应刷第二索书号文字的数量至少为3个第三索书号字符水平排列第四索书号贴在书脊的下半部分。它的算法流程如图22所示实验结果证明该方法具有定位精度高准确率高抗噪能力强并在“索书号自r
好听全球资料 返回顶部