码迷,mamicode.com
首页 >  
搜索关键字:anaconda 数据挖掘 机器学习    ( 12837个结果
Hadoop专业解决方案-第3章:MapReduce处理数据
Hadoop的核心处理模块是MapReduce,也是当前最流行的大数据处理架构之一。它能够将Hadoop数据存储无缝的融入到数据处理当中,使得它在操作上足够简单,功能上足够强大。MapReduce已经解决很多实际问题(从日志分析,到数据排序,到文本操作,到基于模式的搜索,到图像处理,到机器学习等等)...
分类:其他好文   时间:2014-05-27 00:14:28    阅读次数:449
时间序列数据挖掘综述
时间序列数据挖掘综述http://hi.baidu.com/superkiki1989/item/33d609ec4d936204560f1d14一、引言 时间序列是指按时间顺序排列的一组数据,是一类重要的复杂数据对象。作为数据库中的一种数据形式,它广泛存在于各种大型的商业、医学、工程和社会科学.....
分类:其他好文   时间:2014-05-27 00:11:44    阅读次数:392
伤心的快排
#includeusing namespace std;///快排,百度数据挖掘,我面到终面///他们部门经理过来面我///数据挖掘的东西,兵来将挡,水来土掩////讲完项目于对互联网的理解///他说,最后写个快排吧~~~~////FUCK,我没写出来////嚓嚓嚓嚓嚓int AdjustArray...
分类:其他好文   时间:2014-05-26 14:14:50    阅读次数:174
Mahout kmeans聚类
K-means算法是最为经典的基于划分的聚类方法,是十大经典数据挖掘算法之一。K-means算法的基本思想是:以空间中k个点为中心进行聚类,对最靠近他们的对象归类。通过迭代的方法,逐次更新各聚类中心的值,直至得到最好的聚类结果。Mahout kmeans MapReduce实现的原理和上述的一致,值得注意的是,Mahout将数据存储在HDFS,用MapReduce做批量并行的计算。在做kmeans之前,需要将文本用Mahout向量化模块工具做向量化。计算过程主要分为三个步骤:初始中心选取,寻找簇中心,划分数...
分类:其他好文   时间:2014-05-26 06:00:31    阅读次数:239
Mahout 模糊kmeans
FCM 算法用一个Job寻找cluster的中心点。在map的初始化节点,加载初始化(或上一轮迭代的结果)中心点。在map中计算point 和每一个簇的亲和度。在combiner计算同一个cluster的参数,该过程只能计算同一cluster的局部信息。在reduce中首先计算同一个cluster的全局参数,然后计算该cluster是否收敛,输出cluster。...
分类:其他好文   时间:2014-05-26 04:12:39    阅读次数:302
渠道商用假流量冒充真实用户
创业者很苦鳖的,苦于创意,苦于开发,苦于用户体验。创业者很苦鳖的,就算把产品做好了,不推广也很难获得用户。创业者很苦鳖的,遇上无良渠道商,花钱做推广,花时间做换量,可产品还是不见起色。看看一个同样苦鳖的开发者赵学童鞋的自述吧。我做数据挖掘技术出身,并从事推广工作三年,App付费推广的作假现象已屡见不...
分类:其他好文   时间:2014-05-23 05:30:43    阅读次数:262
【炼数成金 RapidMiner 一 】数据挖掘概念与技术原书第三版(第一章)1.9节的习题解
1.数据挖掘是指从大量的数据中提取有用的知识信息的一种模式。(1)因为现在的生活工作中随时随刻都在产生大量的数据和都需要将这些数据转变为有用的信息和知识,是因为需求的不断增加才会突显出数据挖掘技术的重要性,所以数据挖掘应该是信息技术发展带来的结果。(2)数据挖掘应该是这些技术融合而不是简单的变革。(...
分类:Windows程序   时间:2014-05-23 04:42:04    阅读次数:388
ML简史
在科学技术刚刚萌芽的时候,科学家Blaise Pascal和Von Leibniz就想到了有朝一日能够实现人工智能。即让机器拥有像人一样的智能。 机器学习是AI中一条重要的发展线,在工业界和学术界都异常火爆。企业、大学都在投入大量的资源来做机器学习方面的研究。最近,机器学习在很多任务上都有了重大的进步,达到或者超越了人类的水平(例如,交通标志的识别[1],ML达到了98.98%,已超越了人类)。...
分类:其他好文   时间:2014-05-23 02:10:44    阅读次数:635
人类行为真的可预测么?
随着大数据时代的到来,我们越来越多的使用电子产品,使我们的活动信息被越来越多的收集起来。我们知道,机器学习的一大目标就是利用历史数据去预测未来,那么,我们的行为会不会被预测呢?...
分类:其他好文   时间:2014-05-22 22:43:12    阅读次数:557
梦的表征、抽象的思维
梦的表征、抽象的思维——《梦的解析》读后感 据我所知,人类最擅长的一件事就是抽象了。现在人工智能领域所做的工作,最常见的就是利用各种数学的模型解决一些现实生活中的问题。比如,我做过分析的一些东西:数据挖掘技术里面的聚类和分类。初始接触这些东西时的感觉就是玄之又玄,莫名其妙。当一步步接触之后,给我更....
分类:其他好文   时间:2014-05-21 17:36:26    阅读次数:356
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!