介绍朴素贝叶斯的基本原理,接着使用python来实现分类算法。 ...
分类:
编程语言 时间:
2016-10-02 17:32:11
阅读次数:
176
介绍KNN有监督分类以及Kmeans无监督聚类的原理以及简单实践例子。 ...
分类:
编程语言 时间:
2016-10-01 17:25:38
阅读次数:
297
应 CSDN 运营朋友之邀写了一篇观点文章,作为一个刚刚入门的小硕,虽然不才,但厚着脸皮,发表一下自己浅薄的看法。
分类:
编程语言 时间:
2016-09-26 13:16:36
阅读次数:
286
将Mahout on Spark 中的机器学习算法和MLlib中支持的算法统计如下: 主要针对MLlib进行总结 分类与回归 分类和回归是监督式学习; 监督式学习是指使用有标签的数据(LabeledPoint)进行训练,得到模型后,使用测试数据预测结果。其中标签数据是指已知结果的特征数据。 分类和回 ...
分类:
其他好文 时间:
2016-09-24 01:57:49
阅读次数:
250
一,逻辑回归Logistic Regression 逻辑回归是线性模型Y=f(x)=b0+b1*x的延伸,一般用来做2分类问题,输出标记C={0,1},C就是classification的意思,通俗的讲,就要建立Y和C之间的关系,Y是多少的时候,C是0,Y是多少的时候,C是1,传统的线性回归输出的y ...
分类:
编程语言 时间:
2016-09-21 21:35:12
阅读次数:
204
介绍奇异值分解+python代码实践,SVD在图片压缩以及推荐系统中有广泛的应用场景 ...
分类:
编程语言 时间:
2016-09-21 21:33:59
阅读次数:
198
简单介绍决策树的原理,然后python代码来进行实践,使用信息增益作为分裂规则 ...
分类:
编程语言 时间:
2016-09-21 21:27:04
阅读次数:
135
PCA主成份分析 PCA(Principal Component Analysis)主要是为了做数据降维,数据从原来的坐标系转换到登录新的坐标系,新坐标系的选择是由数据本身决定的,第一个新坐标轴选择的是原始数据中方差最大的方向,第二个新坐标轴的选择和第一个坐标轴正交且具有最大方差,该过程一直重复,重 ...
分类:
编程语言 时间:
2016-09-21 21:21:22
阅读次数:
169
KNN分类算法,是理论上比较成熟的方法,也是最简单的机器学习算法之一。 该方法的思路是:如果一个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别,则该样本也属于这个类别。 KNN算法中,所选择的邻居都是已经正确分类的对象。该方法在定类决策上只依据最邻近的一个或者几个样 ...
分类:
编程语言 时间:
2016-09-17 23:21:27
阅读次数:
203
转:http://www.chinakdd.com/article-oyU85v018dQL0Iu.html 前言: 找工作时(IT行业),除了常见的软件开发以外,机器学习岗位也可以当作是一个选择,不少计算机方向的研究生都会接触这个,如果你的研究方向是机器学习/数据挖掘之类,且又对其非常感兴趣的话, ...
分类:
编程语言 时间:
2016-09-14 23:14:40
阅读次数:
250