数据挖掘WEKA实验报告一
Word资料
f
一、实验内容1、Weka工具初步认识(掌握weka程序运行环境)2、实验数据预处理。(掌握weka中数据预处理的使用)
对weka自带测试用例数据集weather
omi
alarrf文件,进行一下操作。
1)、加载数据,熟悉各按钮的功能。2)、熟悉各过滤器的功能,使用过滤器Remove、Add对数据集进行操作。3)、使用wekau
supervisedi
sta
ceRemoveWithValue过滤器去除humidity属性值为high的全部实例。4)、使用离散化技术对数据集glassarrf中的属性RI和Ba进行离散化(分别用等宽,等频进行离散化)。1打开已经安装好的weka界面如下,点击ope
file即可打开weka自带测试用例数据集weather
omi
alarrf文件
Word资料
f
2打开文件之后界面如下:
3可对数据进行选择,可以全选,不选,反选等,还可以
Word资料
f
链接数据库,对数据进行编辑,保存等。还可以对所有的属性进行可视化。如下图:
4使用过滤器Remove、Add对数据集进行操作。
Word资料
f
5点击此处可以增加属性。如上图,增加了一个未命名的属性u
amed再点击下方的remove按钮即可删除该属性5使用wekau
supervisedi
sta
ceRemoveWithValue过滤器去除humidity属性值为high的全部实例。没有去掉之前:
Word资料
f
6去掉其中一个属性之后:
Word资料
f
7选择choose里的removewithvalue:
Word资料
f
8选择humi
ity属性:
Word资料
f
9使用离散化技术对数据集glassarrf中的属性RI和Ba进行离散化(分别用等宽,等频进行离散化)。RI等宽:
Word资料
f
10Ba等频:
二、思考与分析
Word资料
f
1使用数据集编辑器打开weather
omi
alarrf文件,实例编号为2的分类属性值是多少?
如图所示:实例编号为2的分类值属性为
o加载weather
omi
aarrf文件后,temperature属性可以有哪些合法值?Temperature可以取值为:hot、mild、cool
Word资料
fr