到英文单词的概率为121,而对于每三行英文单词碎纸机纵
切未切到英文单词的概率为,然后同上述中文文件的分析过程可知,此时对拼接在文件最左边一列归类时混入上面提到的干扰碎片的概率最大不超过
,最后拼接复原出原英文文件。
模型二的求解
6
f我们利用SPSS软件根据每个碎片顶部空白高度或者文字高度的不同,应用聚类分析方法将碎片聚成11类,结果如下图所示。
图1根据碎片顶部文字高度聚类
7
f图2根据碎片顶部空白高度聚类
结合上面的聚类图,可得出附件3的乱序矩阵,如下表所示。
表6附件3的乱序矩阵4922129178118143188192571419119028186254119565
617911678722069521631773699961967631621316168179130231421918714762768619518261201004150
381677446103148883598241931611051892513012281712052720060851533156170198132172021528316513380141151591281991210717682160733151203169313539134945890149774234112144136124841649747127121183431251318717313966150197182161061811451092111018415720429101041725548171598372065992201644418011175
709332561751531661961374520817468158138537012689151114140102207155101146194119411740123108154185113
8
f同样的方法可得出附件4的乱序矩阵,如下表所示。
表7附件4的乱序矩阵1911471167204106104218419015465391801497546432201809110119810094626196103113172814878146164170
865951117242992581861074615812740983753015019121114578817682194151221551821261411059320271165159203187531120160153853197138129501391236338175201367613536431434117379199179161457320711610815208189168491121181693314211954197616271332119216270236810919560849917490137896156471721412218513216318111025188206279516669178311113034167131441711674134152358355915720542145446656181831081177527248128910214087128125011519377200131124
然后我们先求出附件3碎片与碎片之间的曼哈顿距离,从而得到附件3碎片序号按复原后顺序如下表所示。
表8附件3碎片序号复原后顺序49546514318625719217811819095112212928911881416119786769991629613179631161637261772052361681007662142304123147191501791208619526187183814846161243581189122103130193881672589105747115683132200178033202198151331702058515216527601412831598219913512731602031691343931511071151769434841839047121421241447711214997136164127584312513182109197161841101876610615021173157181204139145296411120159r