搜档网
当前位置:搜档网 › 数据挖掘实验报告-实验1-Weka基础操作

数据挖掘实验报告-实验1-Weka基础操作

数据挖掘实验报告-实验1-Weka基础操作
数据挖掘实验报告-实验1-Weka基础操作

学生实验报告

学院:信息管理学院

课程名称:数据挖掘

教学班级:B01

姓名:

学号:

页脚内容1

实验报告

1. 实验目的和要求:

(1)Explorer界面的各项功能;

注意不能与课件上的截图相同,可采用打开不同的数据文件以示区别。(2)Weka的两种数据表格编辑文件方式下的功能介绍;

①Explorer-Preprocess-edit,弹出Viewer对话框;

页脚内容2

②Weka GUI选择器窗口-Tools | ArffViewer,打开ARFF-Viewer窗口。

(3)ARFF文件组成。

2.实验过程(记录实验步骤、分析实验结果)

2.1 Explorer界面的各项功能

2.1.1 初始界面示意

其中:explorer选项是数据挖掘梳理数据最常用界面,也是使用weka最简单的方法。

Experimenter:实验者选项,提供不同数值的比较,发现其中规律。

KnowledgeFlow:知识流,其中包含处理大型数据的方法,初学者应用较少。

Simple CLI :命令行窗口,有点像cmd 格式,非图形界面。

2.1.2 进入Explorer 界面功能介绍

(1)任务面板

页脚内容3

Preprocess(数据预处理):选择和修改要处理的数据。

Classify(分类):训练和测试分类或回归模型。

Cluster(聚类):从数据中聚类。聚类分析时用的较多。

Associate(关联分析):从数据中学习关联规则。

Select Attributes(选择属性):选择数据中最相关的属性。

Visualize(可视化):查看数据的二维散布图。

(2)常用按钮

页脚内容4

Openfile:打开文件

Open URL:打开URL格式文件

Open DB:打开数据库文件

Generate:数据生成

Undo:撤销操作

Edit:编辑数据

Save:保存数据文件,可实现文件格式的转换,比如csv 格式文件向ARFF格式文件转换等等。(3)筛选数据

页脚内容5

Choose:从这个按钮进去可以选择某个过滤器对数据进行筛选,数据预处理一般使用这个。

Apply:处理完成后,点击这个按钮,处理生效。

(4)数据集的属性关系和操作

current relation:展示了属性的(relation)关系名称,(attributes)属性数,(Insetances)实例数,(sum of weights)权重的总和等多种属性关系。

页脚内容6

Attributes:展示了属性的所有列,上边的四个按钮是对属性列的快捷选择按钮,包括(all)全选,(none)全不选,(Ivert)反选,(patern)模式,选择符合某一条件的属性列。

最下边的remove 按钮可以删除选中的属性列,如果想撤回,可以使用上边提到的undo 按钮~

(5)属性摘要和直方图

Selected attributes:如果是数值属性:属性名(Name)、属性类型(Type)、缺失值(Missing)个数及百分比、不同值(Distinct)数、唯一值(Unique)数及百分比等等。

对于数值属性和标称属性,摘要的方式是不一样的。图中显示的是标签的取值及相应取值的实例数。

选中属性的直方图。若数据集的最后一个属性是类标变量(这是分类或回归任务的默认目标变量,如“play” ),直方图中的每个长方形就会按照该变量的比例分成不同颜色的段。

要想换个分段的依据,在上方的下拉框中选个不同的分类属性就可以了。

下拉框里选上“No Class”或者一个数值属性会变成黑白的直方图。

页脚内容7

相关主题