WEKA学习: CSVLoader按照自己需要加载文本数据,并且经StringToWordVector处理,应用于文本的分类和聚类。...
分类:
其他好文 时间:
2014-07-21 16:25:13
阅读次数:
433
// remove instances with missing class Instances newData = new Instances(data); newData.deleteWithMissingClass(); m_structure = new Instance...
分类:
其他好文 时间:
2014-07-17 22:19:19
阅读次数:
332
1.简介数据挖掘、机器学习这些字眼,在一些人看来,是门槛很高的东西。 诚然,如果做算法实现甚至算法优化,确实需要很多背景知识。但事实是,绝大多数数据挖掘工程师,不需要去做算法层面的东西。他们的精力,集中在特征提取, 算法选择和参数调优上。那么,一个可以方便地提供这些功能的工具,便是十分必要的了。而w...
分类:
其他好文 时间:
2014-07-14 14:55:50
阅读次数:
295
本人也是借鉴网上他人资料。主要介绍使用java调用Weka库。 首先介绍weka,Weka的全名是怀卡托智能分析环境,是基于开源环境的机器学习和数据挖掘软件。我们可以去weka官网下载最新的Weka软件,目前最新版本是3.7.9。默认安装会保存在C:\Program Files\Weka-3-...
分类:
其他好文 时间:
2014-07-11 23:13:24
阅读次数:
269
现在我们介绍使用Weka来对数据进行分类。对数据进行分类,我们必须先指定那一列作为预测类别。因为数据文件格式的问题,类别一般都是最后一列属性。我们可以使用setClassIndex来设置类别。然后我们要选择分类器,分类器有很多,我们暂时使用J48分类器。对数据进行训练可以使用buildClassi....
分类:
其他好文 时间:
2014-07-11 22:22:27
阅读次数:
378
这次我们介绍Evaluation类。在上一次中我们只是单纯的预测了分类值,并没有其他评价数据。这场我们使用Evalution类。首先初始化一个Evaluation对象,Evaluation类没有无参的构造函数,一般用Instances对象作为构造函数的参数。如果我们没有训练数据和测试数据,那么我们可...
分类:
其他好文 时间:
2014-07-11 21:18:34
阅读次数:
259
import java.io.*;import weka.classifiers.*;import weka.classifiers.meta.Vote;import weka.core.Instance;import weka.core.Instances;import weka.core.Sel...
分类:
其他好文 时间:
2014-07-09 21:27:32
阅读次数:
277
回归回归是最为简单易用的一种技术,但可能也是最不强大(这二者总是相伴而来,很有趣吧)。此模型可以简单到只有一个输入变量和一个输出变量(在 Excel 中称为 Scatter 图形,或 OpenOffice.org 内的 XYDiagram)。当然,也可以远比此复杂,可以包括很多输入变量。实际上,所有...
分类:
其他好文 时间:
2014-07-07 23:46:02
阅读次数:
241
一般使用weka进行数据挖掘的时候会碰到两个问题,一是内存不够,二是libsvm使用不了,这时就需要重新配置RunWeka.ini文件,解决上述问题。查看RunWeka.ini原文如下: 1 # Contains the commands for running Weka either with a...
分类:
其他好文 时间:
2014-07-07 17:05:42
阅读次数:
234
数据预处理包括数据的缺失值处理、标准化、规范化和离散化处理。数据的缺失值处理:weka.filters.unsupervised.attribute.ReplaceMissingValues。对于数值属性,用平均值代替缺失值,对于nominal属性,用它的mode(出现最多的值)来代替缺失值。标准化...
分类:
其他好文 时间:
2014-07-01 00:19:47
阅读次数:
392