碎纸片的拼接复原摘要
本文利用MATLAB软件将附件图像数字化,把图像转化为灰度矩阵进行处理。问题一,本文利用边缘匹配模型和灰度匹配模型对碎纸片的边缘作分析。基于,边缘部分的黑白分布越相近,两者相连的可能性越高的原理,得到附件1的排序是008,014,012,015,013,010,002,016,001,004,005,009,013,018,011,007,017,000,006。附件2的排序是003,006,002,007,015,018,011,000,005,001,009,013,010,008,012,014,017,016,004。问题二,本文首先按行将小块进行分类,以简化模型。在附件3中,将碎纸片分组,对分完组后的碎纸片采用字体矩形模型,实现同行间排序,将得到的行再通过匹配模型,从而拼出原文。而对于附件4,本文建立四线格位置模型,将碎纸片进行分组。计算过程中发现部分标号基线相同,但却与不同的行对应匹配,此时进行人工干涉。然后运用行内匹配模型,对同行间的碎纸片排序。附件3、附件4的排序结果见附录一。关键词:灰度矩阵,匹配模型相关性分析三线格基线人工干涉最优化
1
f一问题重述
破碎文件的拼接一直以来都以人工为主,其准确度较高,但效率较为低下,不能承担短时间内完成巨大数量的碎片拼接任务,遏制了在司法物证复原、历史文献修复以及军事情报获取等领域的进一步发展。随着计算机技术的发展,我们尝试运用计算机软件来实现对破碎文件的迅速拼接。现问题如下:
(1)、对于给定的来自同一页印刷文字文件的碎纸机破碎纸片(仅纵切),建立碎纸片拼接复原模型和算法,并针对附件1、附件2给出的中、英文各一页文件的碎片数据进行拼接复原。如果复原过程需要人工干预,请写出干预方式及干预的时间节点。复原结果以图片形式及表格形式表达。
(2)、对于碎纸机既纵切又横切的情形,请设计碎纸片拼接复原模型和算法,并针对附件3、附件4给出的中、英文各一页文件的碎片数据进行拼接复原。如果复原过程需要人工干预,请写出干预方式及干预的时间节点。复原结果表达要求同上。
说明:附件1、附件2为纵切碎片数据,每页纸被切为19条碎片。附件3、附件4为纵横切碎片数据,每页纸被切为11×19个碎片。其中每一附件为同一页纸的碎片数据。
二模型假设
1附件中所给的拼接碎纸片毫无缺失。2附件中的英文严格按照四线格方式打印。3机器印刷时的字间距和行间距大致相同。4碎纸机切割图片是垂直的。5碎纸机切割的碎纸片大小相同、质地均匀。6所有的碎纸片由同一碎纸机切割。7每个附件中所有的碎纸片来自于同一r