本章我们简要介绍下机器学习(Machine Learning)的基本概念。主要介绍机器学习算法的应用,监督学习和无监督学习(supervised-unsupervised learning)的应用场景,训练和测试数据的用法,学习效果评估方式。最后,对scikit-learn进行一些简单的介绍。
自计算机问世以来,计算机可以学习和模仿人类智慧的观点,可谓“引无数英雄竞折腰”...
分类:
其他好文 时间:
2016-06-02 14:10:41
阅读次数:
310
聚类概念: 聚类:简单地说就是把相似的东西分到一组。同 Classification (分类)不同,分类应属于监督学习。而在聚类的时候,我们并不关心某一类是什么,我们需要实现的目标只是把相似的东西聚到一起,因此,一个聚类算法通常只需要知道如何计算相似 度就可以开始工作了。聚类不需要使用训练数据进行学 ...
分类:
编程语言 时间:
2016-06-01 06:45:11
阅读次数:
243
决策树
决策树与随机森林都属于机器学习中监督学习的范畴,主要用于分类问题。
决策树算法有这几种:ID3、C4.5、CART,基于决策树的算法有bagging、随机森林、GBDT等。
决策树是一种利用树形结构进行决策的算法,对于样本数据根据已知条件或叫特征进行分叉,最终建立一棵树,树的叶子结节标识最终决策。新来的数据便可以根据这棵树进行判断。随机森林是一种通过多棵决策树进行优化决策的算法。
案例:...
分类:
其他好文 时间:
2016-05-27 12:04:59
阅读次数:
3744
Dynamic Label Propagation for Semi-supervised Multi-class Multi-label Classification ICCV 2013 在基于Graph的半监督学习方法中,分类的精度高度依赖于可用的有标签数据 和 相似性度量的精度。此处,本文提出 ...
分类:
其他好文 时间:
2016-05-23 17:19:23
阅读次数:
1038
异常检测(anomaly detection)
关于异常检测(anomaly detection)本文主要介绍一下几个方面:
异常检测定义及应用领域常见的异常检测算法高斯分布(正态分布)异常检测算法评估异常检测算法异常检测VS监督学习如何选择使用features多元高斯分布多元高斯分布在异常检测上的应用
一、异常检测定义及应用领域
先来看什么是异常检测?所谓异常检测就是发现与大...
分类:
其他好文 时间:
2016-05-22 12:37:57
阅读次数:
516
1. 写在前面 在机器学习(Machine learning)领域,监督学习(Supervised learning)、非监督学习(Unsupervised learning)以及半监督学习(Semi-supervised learning)是三类研究比较多,应用比较广的学习技术,wiki上对这三种 ...
分类:
其他好文 时间:
2016-05-21 18:58:14
阅读次数:
146
参考学习资料:http://cs229.stanford.edu/materials.html
通过对学习,掌握的知识点包括:
什么是 cost fuction Linear regression的概念Logistic regression的概念
============监督学习的引出==============
机器学习可以分为两个大类,一个是监督学习(superv...
分类:
其他好文 时间:
2016-05-18 19:35:21
阅读次数:
290
聚类与分类聚类(clustering)是指根据“物以类聚”的原理,将本身没有类别的样本聚集成不同的组,这样的一组数据对象的集合叫做簇,并且对每一个这样的簇进行描述的过程。
在分类( classification )中,对于目标数据库中存在哪些类是知道的,要做的就是将每一条记录分别属于哪一类标记出来。
聚类分析也称无监督学习, 因为和分类学习相比,聚类的样本没有标记,需要由聚类学习算法来自动确定。...
分类:
其他好文 时间:
2016-05-18 19:18:17
阅读次数:
291
算法介绍回归和分类回归算法和分类算法通常会被联系在一起,因为两者都可以通过一个或者多个值来预测一个或者多个值 he
为了能够做出预测,两者需要从一组输入和输出中学习预测规则,在学习过程中需要告诉它们问题以及问题的答案
因此,回归和分类都属于监督学习类的算法回归是预测一个数值型的结果,例如温度,成绩等
分类是预测一个标号或者类别,例如邮件是否为辣鸡邮件,一个人是属于哪个人种这里将使用决策树和...
分类:
编程语言 时间:
2016-05-13 03:59:17
阅读次数:
280
华电北风吹
日期:2016-05-07高斯混合模型是一个无监督学习算法,主要用思路是利用EM算法对混合高斯分布进行极大似然估计。一、高斯混合分布
对于有kk个高斯分布混合而成的混合高斯分布的概率密度函数有
p(x)=∑zp(x|z)p(z)(1)p(x)=\sum_z p(x|z)p(z) \tag{1}
对于随机变量zz有zz~Multinomial(?)Multinomial(\phi)...
分类:
其他好文 时间:
2016-05-13 03:40:48
阅读次数:
261