引文: k均值算法是一种聚类算法,所谓聚类,他是一种无监督学习,将相似的对象归到同一个蔟中。蔟内的对象越相似,聚类的效果越好。聚类和分类最大的不同在于,分类的目标事先已知,而聚类则不一样。因为其产生的结果和分类相同,而只是类别没有预先定义。算法的目的: 使各个样本与所在类均值的误差平方和达到最小(这也是评价K-means算法最后聚类效果的评价标准)K-均值聚类
优点:容易实现
缺点:可能收敛到局部最...
分类:
编程语言 时间:
2015-06-03 15:55:40
阅读次数:
139
引文:由于之前讲过了朴素贝叶斯的理论Stanford机器学习[第五讲]-生成学习算法第四部分,同时朴素贝叶斯的算法实现也讲过了,见机器学习算法-朴素贝叶斯Python实现。那么这节课打算讲解一下朴素贝叶斯算法的具体计算流程,通过一个具体的实例来讲解。PS:为了专注于某一个细节,本章节只抽取了视频的一部分来讲解,只讲解一个贝叶斯算法的计算流程,关于视频里面的具体内容请参考下面的视频链接。讲解的实例是一...
分类:
编程语言 时间:
2015-06-01 18:56:18
阅读次数:
172
1.本次课程大纲
局部加权回归: 线性回归的变化版本
Probability interpretation:另一种可能的对于线性回归的解释
Logistic回归: 基于2的一个分类算法
感知器算法: 对于3的延伸,简要讲
牛顿方法(用来对logistic进行拟合的算法,这节课没讲)
2.过拟合与欠拟合的距离评估房子的价格,假设三种拟合算法:
(1)X1=size, 拟合出一条线性曲线;
(2)x...
分类:
其他好文 时间:
2015-05-29 23:16:50
阅读次数:
333
引文:前面提到的K最近邻算法和决策树算法,数据实例最终被明确的划分到某个分类中,下面介绍一种不能完全确定数据实例应该划分到哪个类别,或者说只能给数据实例属于给定分类的概率。基于贝叶斯决策理论的分类方法之朴素贝叶斯
优点:在数据较少的情况下仍然有效,可以处理多类别问题
缺点:对于输入数据的准备方式较为敏感
适用数据类型:标称型数据。
朴素贝叶斯的一般过程
收集数据:可以使用任何方式
准备数据:需要数...
分类:
编程语言 时间:
2015-05-28 14:09:46
阅读次数:
263
本文测试的Spark版本是1.3.1在使用Spark的机器学习算法库之前,需要先了解Mllib中几个基础的概念和专门用于机器学习的数据类型特征向量Vector:Vector的概念是和数学中的向量是一样的,通俗的看其实就是一个装着Double数据的数组
Vector分为两种,分别是密集型和稀疏型
创建方式如下: val array:Array[Double] = ...
val vector...
Here is a nicely complied list of machine learning algorithm cheat sheets. Flowcharts are probably the most efficient way to learn how to do machine l...
分类:
编程语言 时间:
2015-05-27 13:38:02
阅读次数:
1095
由于自己在日常的工作中需要使用到python语言,主要是做数据分析和机器学习算法的实现,因此开始学习python这门语言。根据网友和豆瓣评论,自己选择使用了教材《python简明教程》、《python基础教程》、《利用python进行数据分析》。第一本主要是做入门使用,第二本是系统学习python语...
分类:
编程语言 时间:
2015-05-25 08:33:42
阅读次数:
175
(此文章同时发表在本人微信公众号“dotNET每日精华文章”,欢迎右边二维码来关注。) 题记:机器学习无疑是现在一个高大上的热点,而且微软在Azure提供了机器学习的服务。那么如何更快找到正确的机器学习算法呢?微软也给大家提供了建议。 随着大数据的深入应用,机器学习也从学术界逐步走入到工业界,现在电...
分类:
编程语言 时间:
2015-05-24 23:15:45
阅读次数:
206
【编者按】深度学习在最近两年非常火爆,但深度学习能否取代其他机器学习算法?纽约大学研究生Ran Bi根据Quora上的一个讨论总结了不同的观点,CSDN编辑将其翻译如下,并加上一些国内人工智能专家的观点,供大家参考。 深度学习迅速地成长起来了,并且以其疯狂的实证结果着实令我们惊奇。Quora上...
分类:
编程语言 时间:
2015-05-20 20:11:55
阅读次数:
177
机器学习算法中如何选取超参数:学习速率、正则项系数、minibatch size本文是《Neural networks and deep learning》概览中第三章的一部分,讲机器学习算法中,如何选取初始的超参数的值。(本文会不断补充)学习速率(learning rate,η)运用梯度下降算法进...
分类:
编程语言 时间:
2015-05-19 22:23:04
阅读次数:
167