全球旧事资料 分类
深入浅出谈数据挖掘
段勇编者的话:本文对数据挖掘概念的产生,数据挖掘与常规数据分析的主要区别,数据挖掘与常规数据分析数据挖掘与常规数据分析所能解决的几大类问题和所应用的领域都有着非常清晰的论述。作者在此篇文章中认为数据挖掘最重要的要素是分析人员的相关业务知识和思维模式丰富的业数据挖掘最重要的要素是分析人员的相关业务知识和思维模式。数据挖掘最重要的要素是分析人员的相关业务知识和思维模式务知识是设计有效的相关变量相关变量的必要条件,而分析人员的思维模式从另外一个方相关变量面也保障了设计变量的结构化和完整性。所以我们在掌握丰富的业务知识同时,如果能够按照正确的思维模式去思考问题,将会发现解决问题并不是很困难的。一、数据挖掘的本质数据挖掘的本质
一般来说,比较狭义的观点认为数据挖掘区别于常规数据分析的关键点在于:数据挖掘主要侧重解决四类问题:分类、聚类、关联、预测(关于这四类问分类、分类聚类、关联、题后文会详细阐述),而常规数据分析则侧重于解决除此之外的其他数据分析问题:如描述性统计、交叉报表、假设检验等。描述性统计、交叉报表、假设检验描述性统计让我们来看一个例子:某移动运营商想了解目前彩铃业务的发展现状如何?解决这个问题的方法就是常规的数据分析,常规的数据分析通过描述性统计和交叉报表,可以知常规道目前彩铃业务的用户数、普及率、收入情况?不同品牌用户间的情况和差异?不同消费水平用户间的情况和差异……。这样的分析主要解决了企业过去发生了这样的分析主要解决了企业过去发生了主要解决了企业过去发生什么以及存在什么问题;如果该运营商希望建立一个模型(或者规则)从没有,从没有什么以及存在什么问题以及存在什么问题使用彩铃的用户群中找出一部分用户作为彩铃营销活动的目标用户,如通过短使用彩铃的用户群中找出一部分用户作为彩铃营销活动的目标用户,彩铃的用户群中找出一部分用户作为彩铃营销活动的目标用户信或者外呼的方式告知用户可以免费试用彩铃一个月解决这个问题问题则信或者外呼的方式告知用户可以免费试用彩铃一个月。解决这个问题则需要使告知用户可以免费试用彩铃一个月。用数据挖掘的方法,如通过决策树方法可以找出使用彩铃业务可能性较高的用户用数据挖掘的方法,的一系列特征规则,然后根据这些规则去筛选目标用户。当然数据挖掘也并不是解决这个问题唯一办法,因为在没有数据挖据这个概r
好听全球资料 返回顶部