算法NaiveBayes算法是MicrosoftSQLServerA
alysisServices提供的一种分类算法,用于预测性建模。NaiveBayes算法使用贝叶斯定理,假定一个属性值对给定类的影响独立于其他属性的值。与其他算法相比,该算法所需的运算量小,因而能够快速生成挖掘模型,以发现输入列和可预测列之间的关系。可以使用该算法进行初始数据探测,在用于大型数据库时,该算法也表现出了高准确率与高速度,能与决策树和神经网络相媲美。算法采用监督式的学习方式,在分类之前,需要事先知道分类的类型。通过对训练样本的学习,来有效得进行分类。就是通过训练样本中的属性关系,产生训练样本的中心概念,用这些已经产生的中心概念,对未分类的数据对象进行预测。在SQLServer2008中,我们可以通过挖掘模型查看器来查看NaiveBayes模型。如图3所示。
f在图3中,依赖关系网络可以对数据的分布进一步了解。属性配置文件可以了解每个变量的特性分布情况。属性特征可以看出不同群分类的基本特性概率。属性对比就是呈现属性之间的特性对比。4关联规则算法关联算法规则是要发现数据库中变量和个体之间关系程度,也就是要发现大量数据中项集之间有趣的关联或相关联系。例如,在关联规则挖掘中,典型的例子就是购物篮分析,该分析过程就是通过分析顾客所购买的不同商品之间的联系,来挖掘顾客的购买习惯,并帮助销售商制定营销策略。关联规则算法中有两个重要的参数支持度和置信度。支持度就是指X项集和Y项集中,同时发生X,Y事件的概率。置信度就是指X项集和Y项集中,X事件发生的概率下,Y事件发生的概率。在SQLServer2008中,我们可以通过挖掘模型查看器来查看关联规则模型。如图4所示
在图4中,规则可以查看算法中产生的关联规则,我们可以通过此来了解关联规则内容以及其支持度和置信度。项集可以查看算法中产生的对象组,我们可以通过此来了解各个对象组内容及其支持。依赖关系网络可以呈现产品间的相关性,并通过图形了解产品间的相关性。5顺序分析和聚类分析算法
f顺序分析和聚类分析算法是由MicrosoftSQLServerA
alysisServices提供的一种顺序分析算法。可以使用该算法来研究包含可通过下面的路径或顺序链接到的事件的数据。该算法通过对相同的顺序进行分组或分类来查找最常见的顺序。在SQLServer2008中,我们可以通过挖掘模型查看器来查看顺序分析模型。如图5所示
在图5中分类关系图可以显示挖掘模型中的所有分类,分类之间连线的明暗程度表示分类的相似程度。r