码迷,mamicode.com
首页 >  
搜索关键字:数据挖掘算法    ( 157个结果
数据挖掘算法学习(三)NaiveBayes算法
算法简介 NBC是应用最广的分类算法之一。朴素贝叶斯模型发源于古典数学理论,有着坚实的数学基础,以及稳定的分类效率。同时,NBC模型所需估计的参数很少,对缺失数据不太敏感,算法也比较简单。 算法假设 给定目标值时属性之间互相条件独立。 算法输入 训练数据   T={(x1,y1),(x2,y2),……,(xn,yn)} 待分类数据x0=(x0(1),x0(2),……,x0(n)...
分类:其他好文   时间:2014-07-28 16:17:13    阅读次数:412
数据挖掘算法学习(一)K-Means算法
算法简介: K-Means算法是输入聚类个数k,以及包含n个数据对象的数据库,输出满足方差最小标准的k个聚类。并使得所获得的聚类满足:同一聚类中的对象相似度较高;而不同聚类中 对象相似度较小。 算法假设: 均方误差是计算群组分散度的最佳参数。 算法输入: 聚类个数k;...
分类:其他好文   时间:2014-07-28 00:03:39    阅读次数:343
hadoop1-构建电影推荐系统
问题导读:1. 推荐系统概述;2. 推荐系统指标设计;3. Hadoop并行算法;4. 推荐系统架构;5. MapReduce程序实现。前言Netflix电影推荐的百万美金比赛,把“推荐”变成了时下最热门的数据挖掘算法之一。也正是由于Netflix的比赛,让企业界和学科界有了更深层次的技术碰撞。引发...
分类:其他好文   时间:2014-06-25 09:46:57    阅读次数:329
输入法之模型训练
输入法,尤其是拼音输入法,解决的就是一些序列标注的问题,针对给定的状态(拼音),获取其概率最高的隐状态(中文)。 这个是一个标准的HMM,针对HMM的解码过程,是一个很成熟也很完备的东西。 local的计算和存储能力都有限,我们选择一般是二阶马尔科夫,也就是所谓的bigram model。 高阶对质量会有帮助,但是涉及到存储和计算,工程上不可行。 同理,利用ME 以及CRFmodel...
分类:其他好文   时间:2014-06-10 18:18:23    阅读次数:208
数据结构快速回顾——开篇
六月到了。开始找工作的节奏,IT方面知识储备严重欠缺,定计划,更新博客,记录自己的准备历程。1、数据结构 15天2、常用算法(排序、动态规划、贪心等) 30天3、数据挖掘算法 15天4、移动端、web端开发入门 15天5、操作系统 10天共计85天,那时将近9月,还能赶上找工作的大潮。何...
分类:其他好文   时间:2014-06-02 11:46:07    阅读次数:314
Mahout kmeans聚类
K-means算法是最为经典的基于划分的聚类方法,是十大经典数据挖掘算法之一。K-means算法的基本思想是:以空间中k个点为中心进行聚类,对最靠近他们的对象归类。通过迭代的方法,逐次更新各聚类中心的值,直至得到最好的聚类结果。Mahout kmeans MapReduce实现的原理和上述的一致,值得注意的是,Mahout将数据存储在HDFS,用MapReduce做批量并行的计算。在做kmeans之前,需要将文本用Mahout向量化模块工具做向量化。计算过程主要分为三个步骤:初始中心选取,寻找簇中心,划分数...
分类:其他好文   时间:2014-05-26 06:00:31    阅读次数:239
数据挖掘算法之k-means算法
系列文章:数据挖掘算法之决策树算法 [QQ群: 189191838,对算法和C++感兴趣可以进来] k-means算法可以说是数据挖掘中十大经典算法之一了,属于无监督的学习。该算法由此衍生出了很多类k-means算法,比如k中心点等等,在数据挖掘领域,很多地方都会用到该算法,他能够把相似...
分类:其他好文   时间:2014-04-29 10:26:46    阅读次数:491
157条   上一页 1 ... 14 15 16
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!