关系。然后在各个方向上,按照次序依次尝试将汉字以及它周围的汉字组成词组以及句子。当然,尝试的方向可以有优先顺序同时可以具有适宜的数量,比如先进行行识别,然后进行列识别,最后进行其它方向的识别。同时方向的数量是8个,分别是上下左右,以它们的及其夹角方向。最后根据组成的词句的数量以及质量的判断,来确定当前的文字是行还是列排列,或者是其它的排列方式,当然也可以结合用户手动指定排列方式的方法。而词句的质量可以由此词句的使用频率来判断。在确定了排列方式之后,就能算出其按照这种排列单位的数量。比如,判断出图11按照行排列,那么就能判断出其有三行。至于判断的方式,可以通过每一列的方向上的汉字的数量来判断,如在图11中,根据存储的汉字之间的方向关系可以判定出每一列的汉字都是三个,或者说三个是最多的,并且大于一个概率如90之后,就一这个数量作为有多少行的数量。同时通过汉字之间的位置关系可以将同一行的汉字识别出来。如果将每一列的汉字进行排序,也就是在每一列的汉字具有相同序号的那么就在同一行。当然在进行汉字行列判断的时候一定会碰到部分“连体”汉字的情况发生,如何识别,或者说区分也是一个重要的问题。在这里,人眼识别汉字的时候更多的是一种综合性的识别,而不是仅仅通过笔画或者各个组成部分之间的大小等等来判断一个汉字的。所以这里也许可以首先来判断这一个“连体”的部分究竟有多少个汉字,这一点可以通过其它汉字的大小,空格关系,以及它们与当前所在行或者列的词句的组成关系来确定。在确定了多少个汉字之后,再根据汉字笔画的趋势,空白部分和书写部分的关系,它们各个笔画相对位置的关系,以及汉字笔画密度点的关系,以及汉字和他们整体块大小的关系,以及它们通过其它词句确定的部分词组关系来确定这
5
f“连体”的汉字。最后,在这些识别的过程之后一定要将汉字本身具有的发音相似和形体相似考虑进去,如在当前的识别中未发现与当前可能词组匹配度足够高的汉字或者是未发现和此句子匹配度足够高的词组,那么就可以考虑发音相似和形体相似的汉字。最后,本文的各种思想也许并不是很完善,但是未来的模式识别不仅仅是简单的识别,从人工智能的角度出发来改进手写体识别的算法,必定是未来的一个方向。结论从人工智能的角度来对当前手写体汉字的算法进行改进,将会是提高手写体汉字识别率的一个新途径。参考文献1张学工:模式识别,北京清华大学r