全球旧事资料 分类
信息处理技术。它一般排除人为因素而通过自动的方式,来发现数据中新的、隐藏的或不可预见的模式或活动。这些模式是指隐藏在大型数据库、数据仓库或其他大量信息存储的知识。利用数据仓库中包含的信息,数据挖掘可以发现审计人员原先根本没有想过的问题。它是在对数据集全面而深刻认识的基础上,对数据内在和本质的高度抽象和概括,也是对数据从理性认识到感性认识的升华。数据挖掘方法千差万别,不同的方法应用于不同的领域和对象。选取合适可行的挖掘算法对挖掘的效果起着重要的作用,它将直接影响到决策。在世纪运用过程中,很多挖掘方法不是单独使用的,它往往和其他方法结合起来,才能产生预期的效果。
(一)关联分析方法。关联(Associatio
)分析技术是从操作数据库的所有细节或事务中抽取频繁出现的模式。这种方式促进了关联规则的发展,关联规则总结了一组事件或条目与其他事件或条目的相互联系。关联算法下的规则经常这样表述,如“包含A、B、C项的记录中有83的记录也包含D、E项。”其中的百分比表示规则的可信程度,关联在规则两边可以有任意多个条目。货篮分析是关联分析中最常用的形式,用支持度(Support)和置信度(Co
fide
ce)两个属性来度量。组成“支持度-置信度”框架。经过分析购物者篮子中的产品,并使用关联规则算法对大量篮子进行比较,就可以发现特定产品之间的密切关系了。
f在对财务数据或经济数据的审计中,同类或不同类会计科目及数据项之间可能存在某种对应关系,按照非财务逻辑关系的规律来查找、挖掘,可发现一些隐藏的经济活动,为审计人员的进一步工作提供参考。
(二)聚类分析方法。运用聚类分析可进行一些“孤立点”的挖掘。所谓“孤立点”就是存在一些数据,他们不符合数据的一般模型。数据中的异常点可能隐藏了重要的信息,反映了企业经营中潜伏的问题或暗藏的商机。孤立点挖掘通常描述为:给定一个
个数据点或对象的集合及预期的孤立点数目k,发现与剩余的数据相比时显著相异的、异常的或不一致的k个数据。孤立点挖掘运用广泛,能用于欺诈检测,如探测不寻常的信用卡使用或电信服务;在市场分析中可以用于确定极低或极高收入的客户的消费行为。
(三)神经网络方法。神经网络是一门活跃的边缘性交叉学科,其中以人工神经网络最具代表性。神经网络既是高度非线性动力学系统,又是自组织自适应系统,可以用来描述认知、决策和控制的智能行为。人工神经网络(ArtificialNeuralNetwork,ANN)是相对r
好听全球资料 返回顶部