业保险金的确定对受险人员的分类有助于确定适当的保险金额度。通过数据挖掘可以得到对不同行业的人、不同年龄段的人、处于不同社会层次的人的保险金该如何确定。险种关联分析分析购买了某种保险的人是否同时购买另一种保险。预测什么样的顾客会购买新险种。
3.3数据挖掘技术在零售企业中的应用从超市销售管理系统、客户资料管理及其他运营数据中,可以收集到关于商品销售、客户信息、库存及超市店面信息等的信息资料。数据从各种应用系统中采集,经按不同条件分类,存放到数据仓库,允许管理人员、分析人员、采购人员、市场人员和客户访问,利用数据挖掘工具对这些数据进行分析,为管理者提供高效的科学决策工具。
4.数据挖掘应用实例4.1提出问题。一个自行车厂商想要通过广告宣传来吸引顾客。他们从各地的超市获得超市会员的信息,计划将广告册和礼品投递给这些会员。但是投递广告册是需要成本的,不可能投递给所有的超市会员。而这些会员中有的人会响应广告宣传,有的人就算得到广告册不会购买。所以最好是将广告投递给那些对广告册感兴趣从而购买自行车的会员。分类模型的作用就是识别出什么样的会员可能购买自行车。4.2自行车厂商首先从所有会员中抽取了1000个会员,向这些会员投递广告册,然后记录这些收到广告册的会员是否购买了自行车。数据如表1所示。
表1.会员实例模型数据
事例列会员编号
12496
14177
2438125597……
7
f婚姻状况MarriedMarried
Si
gleSi
gle……
性别收入孩子数
Female40000
1
Male80000
5
Male70000
0
Male30000
0
教育背景
PartialBachelors
College
BachelorsBachelors
输入列
职业
SkilledProfessio
alProfessio
alClerical
Ma
ual
是否有房
Yes
No
Yes
No
汽车数
0
2
1
0
上班距离01Miles25Miles510Miles01Miles
区域
EuropeEurope
PacificEurope
年龄
42
60
41
36
预测列是否购买自行车No
No
Yes
Yes
在分类模型中,每个会员作为一个事例,居民的婚姻状况、性别、年龄等特征作为输入列,所需预测的分类是客户是否购买了自行车。
4.3训练数据集填充模型使用1000个会员事例训练模型后得到的决策树分类如图1所示:
8
f图1.会员事例训练模型后得到的决策树分类
4.3.1图中矩形表示一个拆分节点,矩形中文字是拆分条件。矩形颜色深浅代表此节点包含事例的数量,颜色越深包含的事例越多,如全部节点包含所有的1000个事例,颜色最深。经过第一次基于年龄的拆分后,年龄大于67岁的包含36个事例,年龄小于32岁的133个事例,年龄在39和67岁之间的602r