单选题
1某超市研究销售纪录数据后发现,买啤酒的人很大概率也会购买尿布,这种属于数据挖
掘的哪类问题?A
A关联规则发现
B聚类
C分类
D自然语言处理
2以下两种描述分别对应哪两种对分类算法的评价标准?A
a警察抓小偷,描述警察抓的人中有多少个是小偷的标准。
b描述有多少比例的小偷给警察抓了的标准。
APrecisio
RecallBRecallPrecisio
APrecisio
ROCDRecallROC
3将原始数据进行集成、变换、维度规约、数值规约是在以下哪个步骤的任务?C
A频繁模式挖掘B分类和预测C数据预处理D数据流挖掘
4当不知道数据所带标签时,可以使用哪种技术促使带同类标签的数据与带其他标签的数
据相分离?B
A分类
B聚类
C关联分析
D隐马尔可夫链
5什么是KDD?A
A数据挖掘与知识发现B领域知识发现
C文档知识发现
D动态知识发现
6使用交互式的和可视化的技术,对数据进行探索属于数据挖掘的哪一类任务?(A)
A探索性数据分析B建模描述
C预测建模D寻找模式和规则
7为数据的总体分布建模;把多维空间划分成组等问题属于数据挖掘的哪一类任务?B
A探索性数据分析B建模描述
C预测建模D寻找模式和规则
8建立一个模型,通过这个模型根据已知的变量值来预测其他某个变量值属于数据挖掘的
哪一类任务?C
A根据内容检索B建模描述
C预测建模D寻找模式和规则
9用户有一种感兴趣的模式并且希望在数据集中找到相似的模式,属于数据挖掘哪一类任
务?A
A根据内容检索B建模描述
C预测建模D寻找模式和规则
11下面哪种不属于数据预处理的方法?D
A变量代换B离散化C聚集D估计遗漏值
12假设12个销售价格记录组已经排序如下:5101113153550557292204215使
用如下每种方法将它们划分成四个箱。等频(等深)划分时,15在第几个箱子内?B
A第一个
B第二个C第三个D第四个
13上题中,等宽划分时(宽度为50),15又在哪个箱子里?A
A第一个
B第二个C第三个D第四个
14下面哪个不属于数据的属性类型:D
A标称B序数C区间D相异
15在上题中,属于定量的属性类型是:C
A标称B序数C区间D相异
16只有非零值才重要的二元属性被称作:C
fA计数属性B离散属性C非对称的二元属性D对称属性
17以下哪种方法不属于特征选择的标准方法:
D
A嵌入B过滤C包装D抽样
18下面不属于创建新属性的相关方法的是:B
A特征提取B特征修改C映射数据到新的空间D特征构造
19考虑值集1、2、3、4、5、90r