全球旧事资料 分类
通过调整分类右侧的滑块,可以调整显示的连线数。类分剖面图提供算法创建的分类的总体视图,显示了分类中的每个属性以及属性的分布。分类特征可以检查分类的组成特征。分类对比可以比较两个分类的属性。状态转换可以在选中一个分类后,可在选中的分类中浏览序列状态之间的转换。6时序算法时序算法提供了一些针对连续值预测进行了优化的回归算法,并将时间序列分解成主要趋势成分,季节变化成分,并检验理论模型是否能反应现象。在SQLServer2008中,我们可以通过挖掘模型查看器来查看时序模型。如图6所示
f在图6中,图表栏显示预测变量个产品过去值以及预测值,以及误差区间。模型将算法以完成的模型显示为树。
时序算法是MicrosoftSQLServer2005A
alysisServicesSSASMicrosoft时序算法提供的回归算法,用于创建数据挖掘数据挖掘模型以预测连续列,如预测方案中的产品销数据挖掘售额。其他Microsoft算法创建依靠给定输入列来预测可预测列的模型(如决决策树模型),而时序模型的预测则仅根据算法在创建模型时从原始数据集派生的策树趋势。以下关系图显示了一个典型模型,用于预测各个时间的销售额。
关系图中显示的该模型由两部分组成:历史信息以红色显示,预测信息以蓝色显示。红色数据代表算法用于创建模型的信息,而蓝色数据则代表模型作出的预测。由红色数据和蓝色数据联合形成的线称为“序列”。每个预测模型必须包含一个事例序列,即区分序列列中不同点的列。例如,因为关系图中的数据显示了几个月中的历史和预测销售额序列,因此数据列为事例序列。Microsoft时序算法的一个重要功能就是可以执行交叉预测。也就是说,如果使用两个单独但相关的序列为该算法定型,就可以使用得到的模型根据其他序列的行为预测一个序列的结果。例如,一个产品的实际销售额可能会影响另一个产品的预测销售额。示例Adve
tureWorksCycle公司的管理层希望预测来年的自行车每月销售额。该公司尤其关注的是不同型号的自行车的销售是否彼此相关,一种自行车型号的销售情况是否可用于预测另一种型号的销售情况。通过对过去三年的历史数据使用Microsoft时序算法,该公司可以生成一个数据挖掘模型,用于预测未来的自行车销售情况。此外,该公司还可以执行交叉预测,以查看各个自行车型号的销售趋势是否相关。算法的原理Microsoft决策树算法通过使用自动回归决策树来为模型定型。每个模型都包含一个KEYTIME列,该列定义了模型将定义的时间段。该算法将过去的项的可变r
好听全球资料 返回顶部