,分别是文件最左边一列碎片和最上面一行碎片,然后类似于问题一的处理方法,应用最小曼哈顿距离对每一类碎片按正确顺序拼接,此后对其余碎片再应用最小曼哈顿距离逐一进行拼接,直至剩余所有的碎片都拼接上。
问题三中,题目要求考虑双面打印文件的碎纸拼接复原问题的解决方案,此时每页纸虽然也是被切为209个碎片,但每个碎片却有正反两面,因此经过处理得到418个数值矩阵,,此时我们分别对每一面各自进行类似问题一的处理,然后综合每一面的聚类情况再应用最小曼哈顿距离对双面碎纸片进行拼接复原。
三、模型假设
1假设碎纸机破碎纸片(纵切或横切)得到的碎纸片是规则且边缘是整齐的等大的矩形;2假设我们对文档碎纸片拼接复原不考虑碎片边缘的尖点特征、尖角特征、面积特征等基于边界几何特征;3假设附件中给出的所有中、英文文件中的文字排版是按标准格式排版的。4假设附件中给出的所有中、英文字符都是统一格式,且内容为普通文章。
四、符号说明
3
f序号12345
符号
AiXi
Yi
dXiYj
符号说明数值矩阵
数值矩阵Ai的最左边列向量数值矩阵Ai的最右边列向量
曼哈顿距离隶属函数中的阀值
五、模型建立与求解
51问题一(曼哈顿距离)模型一的建立题目要求对于给定的来自同一页印刷文字文件的碎纸机破碎纸片(仅纵切)
建立碎纸片拼接复原模型和算法,并且要对中、英文各一页文件的碎片数据分别进行拼接复原。首先,我们利用数学软件MATLAB软件将19条碎片数据化,得到19
个像素值矩阵,像素值的变化范围是从0变化到255,此时我们设置127为阈
值对像素值矩阵进行二值化处理,当矩阵某位置像素值小于等于时,则将对应位置的数值设为0;当矩阵某位置像素值大于时,则将对应位置的数值设为
127。这样我们就得到19个二值化了的数值矩阵Ai,对于每个数值矩阵Ai,我们依次取出最左边一列从上至下各格的值组成一个向量,记为Xi,同样的我们
依次取出最右边一列从上至下各格的值组成一个向量,记为Yi。计算出每一数值矩阵的左边向量与所有非同源数值矩阵的右边向量的曼哈顿距离dXiYj。
模型一的求解
对于得到的向量Xixi1xi2xikTk12m和向量Yiyi1yi2yikTk12
,两向量的曼哈顿距离为
4
f
dXiYjxikyjkk1
ij12m且ij。可求出附件1碎片与碎片
之间的曼哈顿距离,如下表所示。
表1附件1碎片与碎片间的曼哈顿距离
编号0123456789101112131415161718编号6416105981714132715181231011r