分析法、回归分析法以及聚类分析法等对数据进行处理,方法较为简便,容易学习。
(2)决策树和决策规则
决策树和决策规则方式是人工智能形式的归纳学习方法,通过将问题分解为若干个子集来进行分析,该方法是典型的通过逻辑模型进行输入的数据挖掘方法,该方法在处理非数值型的数据时具有很强的优越性。
(3)关联规则
关联规则是通过发现数据项间是否具有如果那么的因果关系而对大量数据进行区分、寻找,当然,这种关系有可能是人为定义的而数据本身并不具备相应的特点,选取的数据间也不一定具有必须的因果关系或相关性,仅仅是为了选择具有一定的普适性。
(4)遗传算法
遗传算法是根据生物学中的相关理论而演变过来的一种数据挖掘方式,采用了生物学中的自然选择自然选择、遗传交叉以及遗传变异等设计方法,在分析过程中将问题假定为染色体,能够进行遗传,按照适者生存的法则,淘汰掉无法适应环境的染色体,继续进行交叉、变异,不断的往复,从而找到最适合环境的染色体,也即为我们需要的最优的数据解。遗传算法目前在图像处理、工业优化控制方面得到了广泛的应用。
(5)人工神经网络
人工神经网络是一种基于人体大脑神经连接、传递而演变的数学方法,神经网络可以看做是一个大型的运算模型,模型之间通过节点构成,每个节点代表一种特点的激励函数,而节点间的连接为权重,数据的最终输出成果与激励函数和权重有较大关系,一般通过对已有数据的学习,建立适合的逻辑表达,即输入数据与结果间的一种未知联系,从而构成神经网络系统,对其他大量的数据进行分析、预测,神经网络应用中学习样本数量越多,则其网络结构也越准确,预测结果也具有更大的可靠性。
(6)模糊逻辑
f龙源期刊网httpwwwqika
comc
模糊分析是今年来发展起来的一种数据挖掘技术,以往的分类系统往往是根据确定的规则进行分类、决策,但实际中很多概念和数据都是不确定的,具有很强的模糊性,因此,在数学处理中引入假定的模糊逻辑,从而实现了对更高层次内容的抽象处理,其在对数据的初步分类中应用非常广泛,且具有较高的可靠性。
3数据挖掘中的聚类分析技术
聚类分析是将数据对象依据样本间的关联的度量标准将数据进行分组为多个类或簇的数据挖掘技术,同一类中的样本相似,不同类的样本相异。将一组样本和一个度量两个样本间相似度的标准作为参数输入到聚类分析系统中,通过分析可以的到具有标准相似度的多个样本类,通过对每个类所进行的综合描述说明,促进了r