数据预处理包括数据的缺失值处理、标准化、规范化和离散化处理。数据的缺失值处理:weka.filters.unsupervised.attribute.ReplaceMissingValues。对于数值属性,用平均值代替缺失值,对于nominal属性,用它的mode(出现最多的值)来代替缺失值。标准化...
分类:
其他好文 时间:
2014-07-01 00:19:47
阅读次数:
392
推荐过程主要分成了如下几步来完成推荐1. 输入数据预处理2. 获取评分矩阵3.
计算物品相似度4. 矩阵乘法5. 数据过滤6. 计算推荐 测试数据user&item12345 133320 244400 355503 444414
继...
分类:
其他好文 时间:
2014-06-13 20:16:26
阅读次数:
226
问题由来在很多机器学习任务中,特征并不总是连续值,而有可能是分类值。例如,考虑一下的三个特征:["male","female"]["from
Europe","from US","from Asia"]["uses Firefox","uses Chrome","uses
Safari","uses...
分类:
其他好文 时间:
2014-06-04 17:03:02
阅读次数:
344
乒乓操作的优势:乒乓操作常常应用于流水线式算法,完成数据的无缝缓冲与处理。节省缓冲区空间可以使用低速模块处理高速模块第三点的实现方式:(实例)
A端输入速率1Mbps的信号,DPRAM存储量大于1M bit,数据流运算处理模块的处理速度为1 Mps,数据预处理模块1&2的处理速度是0.5
Mbps;...
分类:
其他好文 时间:
2014-06-03 08:22:17
阅读次数:
218
这篇博客根据中文自然语言预处理的步骤分成几个板块。以做LDA实验为例,在处理数据之前,会写一个类似于实验报告的东西,用来指导做实验,OK,举例:一,实验数据预处理(python,结巴分词)1.对于爬取的评论做分词和词性标注处理(mac-result.txt)2.对于结果只用公版的停用词表去停用词,不...
分类:
编程语言 时间:
2014-06-03 06:45:21
阅读次数:
385