码迷,mamicode.com
首页 >  
搜索关键字:数据预处理    ( 485个结果
WEKA中的数据预处理
数据预处理包括数据的缺失值处理、标准化、规范化和离散化处理。数据的缺失值处理:weka.filters.unsupervised.attribute.ReplaceMissingValues。对于数值属性,用平均值代替缺失值,对于nominal属性,用它的mode(出现最多的值)来代替缺失值。标准化...
分类:其他好文   时间:2014-07-01 00:19:47    阅读次数:392
Mahout协同过滤框架Taste的源码分析
推荐过程主要分成了如下几步来完成推荐1. 输入数据预处理2. 获取评分矩阵3. 计算物品相似度4. 矩阵乘法5. 数据过滤6. 计算推荐 测试数据user&item12345 133320 244400 355503 444414 继...
分类:其他好文   时间:2014-06-13 20:16:26    阅读次数:226
机器学习实战:数据预处理之独热编码(One-Hot Encoding)
问题由来在很多机器学习任务中,特征并不总是连续值,而有可能是分类值。例如,考虑一下的三个特征:["male","female"]["from Europe","from US","from Asia"]["uses Firefox","uses Chrome","uses Safari","uses...
分类:其他好文   时间:2014-06-04 17:03:02    阅读次数:344
乒乓操作
乒乓操作的优势:乒乓操作常常应用于流水线式算法,完成数据的无缝缓冲与处理。节省缓冲区空间可以使用低速模块处理高速模块第三点的实现方式:(实例) A端输入速率1Mbps的信号,DPRAM存储量大于1M bit,数据流运算处理模块的处理速度为1 Mps,数据预处理模块1&2的处理速度是0.5 Mbps;...
分类:其他好文   时间:2014-06-03 08:22:17    阅读次数:218
用python做中文自然语言预处理
这篇博客根据中文自然语言预处理的步骤分成几个板块。以做LDA实验为例,在处理数据之前,会写一个类似于实验报告的东西,用来指导做实验,OK,举例:一,实验数据预处理(python,结巴分词)1.对于爬取的评论做分词和词性标注处理(mac-result.txt)2.对于结果只用公版的停用词表去停用词,不...
分类:编程语言   时间:2014-06-03 06:45:21    阅读次数:385
485条   上一页 1 ... 47 48 49
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!