0.注意weka的中文编码RunWeka.ini 》fileEncoding=utf-81.首先对分词后的 无新词发现的分词文件,转换成arff文件 命令java weka.core.converters.TextDirectoryLoader -dir D:\weibo\catagory\data ...
分类:
其他好文 时间:
2016-12-11 21:08:37
阅读次数:
201
1) 数据输入和输出WOW():查看Weka函数的参数。Weka_control():设置Weka函数的参数。read.arff():读Weka Attribute-Relation File Format (ARFF)格式的数据。write.arff:将数据写入Weka Attribute-Rel ...
分类:
编程语言 时间:
2016-05-22 23:05:23
阅读次数:
174
> java weka.clusterers.SimpleKMeans -p 1 -l G:\Program\data_Factory\example.model -T G:\Program\data_Factory\save_file_ID2Class.arff 0 1 (0) 1 2 (0) 2...
分类:
其他好文 时间:
2015-09-08 15:30:50
阅读次数:
289
1) 数据输入和输出WOW():查看Weka函数的参数。Weka_control():设置Weka函数的参数。read.arff():读Weka Attribute-Relation File Format (ARFF)格式的数据。write.arff:将数据写入Weka Attribute-Rel...
分类:
编程语言 时间:
2015-06-05 20:54:58
阅读次数:
148
weka直接支持的是Arff文件格式,同时也可以支持CSC、XSL等,但最后也需转换为Arff格式。但是,在训练集、测试集加载过程中出现了一系列的错误,究其原因,都是没有遵循某种规范,且让我们好好看下这些错误吧:问题1.错误:not recognized as an 'CSV data files'...
分类:
其他好文 时间:
2015-06-05 13:41:33
阅读次数:
242
书接上文,考虑4个核心功能的实现,先考虑:数据预处理和按纬度统计。1、数据预处理1.1、基本原则首先,考虑数据的格式。业务数据是保存在关系型数据库中的。数据分析的部分,我们将使用Weka,虽然Weka习惯ARFF格式,为了实现数据分析和提取的自动化,我们将通过Weka的JDBC接口为其提供数据。这样,可以使用ETL工具或者通过程序代码执行SQL实现数据提取和格式转换。
在开发阶段,我们基本上可以将...
分类:
其他好文 时间:
2015-05-29 08:40:35
阅读次数:
183
前一阵子写过一个arff的随笔,但是写完后发现有些啰嗦。其实如果使用weka自带的api,生成arff文件将变成一件很简单的事儿。首先,可以先把特征文件生成csv格式的。csv格式就是每列数据都用逗号分隔的一种格式。(还有不清楚的googling一下就知道了)一、首先看下特征文件怎么保存成csv格式...
分类:
其他好文 时间:
2015-05-23 22:34:54
阅读次数:
871
weka中的过滤器主要用于数据预处理阶段对数据集的各种操作。今天简单地使用一下过滤器:首先打开一个自带数据集weather.numeric.arff,这是一个关于通过天气条件,气温以及风力等因素来判断是否要play。可以看到:看一下数据的大致情况:红色代表no,蓝色代表yes。问题一:假设我现在要添...
分类:
其他好文 时间:
2015-05-15 13:22:49
阅读次数:
222
在这里,arff文件以Weka安装目录下data文件夹中的iris.arff文件为例。
1、先在weka中将arff文件转换为csv文件,然后删除csv文件中第一行对属性名的描述,如下图。
2、保存,并放到数据库数据文件目录下(如C:\ProgramData\MySQL\MySQL Server 5.5\data\weka);
3、在navicat下对应的数据库建立数据表,本例中:crea...
分类:
数据库 时间:
2015-05-11 10:49:15
阅读次数:
812
RWeka(http://cran.r-project.org/web/packages/RWeka/index.html) :1) 数据输入和输出WOW():查看Weka函数的参数。Weka_control():设置Weka函数的参数。read.arff():读Weka Attribute-Rel...
分类:
编程语言 时间:
2015-01-29 22:17:53
阅读次数:
187