1、数据挖掘-WEKA实验报告一姓名及学号 : 杨珍 20131198 班级 : 卓越计科 1301 指导老师 : 吴珏老师 一、实验内容1、 Weka 工具初步认识(掌握 weka 程序运行环境)2、 实验数据预处理。(掌握 weka 中数据预处理的使用)对 weka 自带测试用例数据集 weather.nominal.arrf 文件,进行一下操作。1) 、加载数据,熟悉各按钮的功能。2) 、熟悉各过滤器的功能,使用过滤器 Remove、Add 对数据集进行操作。3) 、使用 weka.unsupervised.instance.RemoveWithValue 过滤器去除 humidity属性值
2、为 high 的全部实例。4) 、使用离散化技术对数据集 glass.arrf 中的属性 RI 和 Ba 进行离散化(分别用等宽,等频进行离散化) 。(1)打开已经安装好的 weka,界面如下,点击 openfile 即可打开 weka 自带测试用例数据集 weather.nominal.arrf 文件(2)打开文件之后界面如下:(3)可对数据进行选择,可以全选,不选,反选等,还可以链接数据库,对数据进行编辑,保存等。还可以对所有的属性进行可视化。如下图:(4)使用过滤器 Remove、Add 对数据集进行操作。(5)点击此处可以增加属性。如上图,增加了一个未命名的属性 unnamed.再点击
3、下方的 remove 按钮即可删除该属性.(5)使用 weka.unsupervised.instance.RemoveWithValue 过滤器去除 humidity 属性值为 high 的全部实例。没有去掉之前:(6)去掉其中一个属性之后:(7)选择 choose 里的 removewithvalue:(8)选择 huminity 属性:(9)使用离散化技术对数据集 glass.arrf 中的属性 RI 和 Ba 进行离散化(分别用等宽,等频进行离散化) 。RI 等宽:(10)Ba 等频:二 、 思 考 与 分 析1.使用数据集编辑器打开 weather.nominal.arrf 文件,实例编号为 2 的分类属性值是多少?如图所示:实例编号为 2 的分类值属性为 no加载 weather.nomina.arrf 文件后,temperature 属性可以有哪些合法值?Temperature 可以取值为:hot、mild、cool