全球旧事资料 分类
距离10211748128811130159112120828434777897124102105
从而可得到附件1碎片序号按复原后顺序如下表所示。
表2附件1碎片序号复原后顺序
8141215310216145913181171706
附件1碎片复原图片如附录中图81所示。
同法可求出附件2碎片与碎片之间的曼哈顿距离,如下表所示。
表3附件2碎片与碎片间的曼哈顿距离
编号编号距离
01234567891011121314151617185976312151213801410171841611966582102071671208712882547513310754935290
从而可得到附件2碎片序号按复原后顺序如下表所示。表4附件2碎片序号复原后顺序
3627151811051913108121417164
附件2碎片复原图片如附录中图82所示。
问题一人工干预情况如下表所示。
表5问题一人工干预情况
人工干干预时干预方干预次数



图像
附件1图像无

0
附件2图像无

0
52问题二(Ma
hatta
距离)
模型二的建立
在中文文件中,两个连续的汉字中间的空白间隔所占像素宽度与其左边或者
5
f2
右边的汉字所占像素宽度的比值最大的约为13,则对于每一行文字,碎纸机纵
2
切未切到文字的概率为13,对于每两行文字碎纸机纵切未切到文字的概率为
4
169,而对于每三行文字碎纸机纵切未切到文字的概率更小,可以忽略不计,所以对于总共209个碎片,每个碎片上面的文字至少有两行(碎片上不完整的一行也算一行),所以出现某个碎片上面的文字完全没被碎纸机切割到(即文字完整
4
无缺)的概率至多为169,我们把这样的碎片称之为干扰碎片。我们知道,整篇文件的最上面一行字的上边缘是空白的,我们可以利用此特
殊性对209个碎纸片进行聚类,可以得到一个特殊的类,即碎纸片上边缘为空白的类,此类碎纸片个数大于等于11;出现个数大于11的情形即为混入上面提到
4
的干扰碎片,此概率最大不超过169,可知此类碎纸片应该拼接在文件最上面一行,应用最小曼哈顿距离对此类碎片按正确顺序拼接。同理可聚类出另一个特殊的类,即碎纸片左边缘为空白、拼接在文件最左边一列的类,并且也应用最小曼哈顿距离对此类碎片按正确顺序拼接。然后以此拼接好的第一行和第一列碎片为基准,再应用最小曼哈顿距离拼接其余剩下的碎片,最后拼接复原出原中文文件。
在英文文件中,一个英文单词中两个连续的英文字母中间的空白间隔所占像
1
素宽度与其左边或者右边的英文字母所占像素宽度的比值最大的约为11,则对
1
于每一行英文单词,碎纸机纵切未切到英文单词的概率为11,对于每两行英文
1
单词碎纸机纵切未切r
好听全球资料 返回顶部