息的比较找出已经丢失的图书。确保电子数据库中的图书状态与书库中的一致以及书库中的图书准确排放从而有效解决上述“用索书号找不到图书”的问题。
12索书号自动识别系统
近年来随着电子计算机技术、图像处理技术和摄像技术的迅速发展图像中的文字信息提
取系统已经成功地应用于各个领域。因此借助其经验本文研究采用图像处理和识别技术
实现索书号的自动识别。
121索书号自动识别系统概述
系统的硬件由彩色CCD摄像头8位图像采集卡和计算机组成拍摄的图像为8位RGB彩色数字图像。如图11所示
122索书号识别存在的问题及关键技术
索书号识别所涉及的摄像技术无线通讯技术电子数据库图书管理技术AGV自动导引技术和图像处理技术都已经在其他领域有成功应用的实例。图像处理技术是索书号识别的核心技术而与相类似的应用相比索书号图像处理与识别又有其自身显著的特点和难点。
图书馆收集了近几十年的藏书不同时代的索书号编写风格大不相同。本论文选取图书馆的主要类别图书印刷体索书号从图书馆的书架上随即抽取样本进行研究。如图7所示CCD摄像头拍摄的索书号图像由于光照不均匀、退色、污迹、噪声以及其他非索书号文字的存在大
f大增加了索书号识别的困难。为了能够解决上述问题索书号图像识别主要由以下4个模块组
成索书号定位索书号提取索书号字符切分和索书号单字识别。
第一阶段索书号定位是在图像中找到包含索书号的图像区域要求该区域尽可能包含完整的索书号同时尽量排除非索书号的图像区域。由于该阶段是解决索书号的区域查找问题而没
有涉及单字切分因此图像区域的估计允许有一定误差。为了包含完整的索书号以及避免索书号
漏检往往是定位得到的图像区域略大于索书号的真实区域。索书号定位主要存在两个问题1受不均匀光照和褪色的影响索书号的纹理特征、颜色特征以及形状特征等有较大的变化可靠性相对较差2有的索书号由1个字符串组成有的索陆号由2个字符串组成而在索书号的周围附近还会存在其他文字如出版社名称和作者姓名。因此将索书号与其他文字相区别比较困难。
第二阶段索书号提取是在定位得到的索书号区域中将索书号字符与周围目标和背景相
互分离。通过二值化处理能将字符与背最相互分离。但由于定位得到的图像区域略大于真实索
书号区域二值化后在索书号字符附近可能会存在一些非字符目标影响后续的单字切分和识别。所以二值化后采用连通域滤波进一步消除索书号周围的非字符目标。索书号提取主要存在的问题1不r