全球旧事资料 分类
的多个领域的理论和技术。而数据库、人工智能和数理
统计是数据挖掘技术的三根强大的技术支柱。数据挖掘的主要任务是借助关联
规则决策树、聚类和基于样例的学习。贝叶斯学习、粗糙集、神经网络、遗传
算法、统计分析等技术采用数据取样选取数据样本、数据探索可视化数据
探索与聚类分析和因子分选、数据调整数据重组细分与添加和拆分记录、模
式化人工神经网络。决策树模型数理统计分析和时问序列分析和评价结论
综合和评价、是否修改数据、有新问题产生等五个基本流程。这一过程可能要
反复进行不断地得到趋近事物的本质不断地优化问题的解决方案通过关联分
析、分类、聚类、预测和偏差检测等发现数据间的关系以及数据间的模式。目
前最常见的数据挖掘技术有模糊逻辑和粗糙集方法、遗传算法、临近搜索算
法等。从功能上讲说可以将数据挖掘的分析方法划分为四种关联分析、序列
模式分析、分类分析和聚类分析。
3数据挖掘技术的主要应用领域
f31电子商务中的web中的数据挖掘应用目前通过Web进行商务活动带来的便利和它所产生的交易速度已成为电子商务迅猛发展的关键推动力。另一方面涉及客户端的电子商务活动也正在进行着巨大的革新。如果能够跟踪客户在Web上的浏览行为并进行模式分析这样将会缩短销售商与客户之间的距离让销售商更了解自己客户的需求有针对性的开展电子商务活动。在I
ter
et上的客户都意识到只要他们连接到一个在线市场的服务器上就已经在这个服务器上留下了一个“脚印”这就是服务器的日志文件。我们就可以对客户访问留下的这些日志文件进行Web的数据挖掘提取关于客户的知识对客户的访问行为、频度、内容等的分析可以得到关于群体客户行为和方式的普遍知识用以改进Web服务方的设计。通过Web数据挖掘就可以根据客户的访问兴趣、访问频度、访问时间动态地调整页面结构改进服务给客户个性化的界面开展有针对性的电子商务以更好的满足访问者的需求。电子商务中进行Web数据挖掘的数据源主要集中在服务器数据日志文件和查询数据、客户自主登记信息。主要采用的技术包括路径分析判定在一个Web站点中最频繁访问的路径及还有一些其他的有关路径的信息、关联规则的发现在电子商务中关联规则的发现也就是要找到客户对网站上各种文件之间访问的相互联系、序列模式的发现序列模式的发现就是在时间戳有序的事务集中找到那些“一些项跟随另一个项”的内部事务模式、分类规则的发现分类发现就是r
好听全球资料 返回顶部