全球旧事资料 分类
学生实验报告
学院:信息管理学院课程名称:数据挖掘教学班级:B01姓名:学号:
f实验报告
课程名称学号实验项目组员名单实验类型实验地点
数据挖掘
教学班级
B01
指导老师
姓名
行政班级
实验一:Weka的基本操作
独立完成
■操作性实验
□验证性实验
□综合性实验
H535
实验日期
20160928
1实验目的和要求:
(1)Explorer界面的各项功能;
注意不能与课件上的截图相同,可采用打开不同的数据文件以示区别。
(2)Weka的两种数据表格编辑文件方式下的功能介绍;①ExplorerPreprocessedit,弹出Viewer对话框;②WekaGUI选择器窗口ToolsArffViewer,打开ARFFViewer窗口。
(3)ARFF文件组成。
2.实验过程(记录实验步骤、分析实验结果)
21Explorer界面的各项功能
211初始界面示意
其中:explorer选项是数据挖掘梳理数据最常用界面,也是使用weka最简单的方法。Experime
ter:实验者选项,提供不同数值的比较,发现其中规律。K
owledgeFlow:知识流,其中包含处理大型数据的方法,初学者应用较少。
fSimpleCLI:命令行窗口,有点像cmd格式,非图形界面。212进入Explorer界面功能介绍(1)任务面板
Preprocess(数据预处理):选择和修改要处理的数据。Classify(分类):训练和测试分类或回归模型。Cluster(聚类):从数据中聚类。聚类分析时用的较多。Associate(关联分析):从数据中学习关联规则。SelectAttributes(选择属性):选择数据中最相关的属性。Visualize(可视化):查看数据的二维散布图。(2)常用按钮
Ope
file:打开文件Ope
URL:打开URL格式文件Ope
DB:打开数据库文件
fGe
erate:数据生成U
do:撤销操作Edit:编辑数据Save:保存数据文件,可实现文件格式的转换,比如csv格式文件向ARFF格式文件转换等等。(3)筛选数据
Choose:从这个按钮进去可以选择某个过滤器对数据进行筛选,数据预处理一般使用这个。Apply:处理完成后,点击这个按钮,处理生效。(4)数据集的属性关系和操作
curre
trelatio
:展示了属性的(relatio
)关系名称attributes属性数,I
seta
ces实例数,sumofweights权重的总和等多种属性关系。
Attributes:展示了属性的所有列,上边的四个按钮是对属性列的快捷选择按钮,包括all全选,
o
e全不选,Ivert反选,(pater
)模式,选择符合某一条件的属性列。
最下边的remove按钮可以删除选中的属性列,如果想撤回,可以使用上边提到的u
do按钮
f(5)属性摘要和直方图
Selectedattributes:如果是数值属性:属性名(Name)、属性类型(Type)、缺失值(Missi
g)个数及百分比、不同r
好听全球资料 返回顶部