机器学习算法与Python实践这个系列主要是参考《机器学习实战》这本书。因为自己想学习Python,然后也想对一些机器学习算法加深下了解,所以就想通过Python来实现几个比较常用的机器学习算法。恰好遇见这本同样定位的书籍,所以就参考这本书的过程来学习了。 这节学习的是逻辑回归(Logistic R ...
分类:
编程语言 时间:
2016-08-14 15:58:21
阅读次数:
237
简介 自2007年发布以来,scikit-learn已经成为Python重要的机器学习库了。scikit-learn简称sklearn,支持包括分类、回归、降维和聚类四大机器学习算法。还包含了特征提取、数据处理和模型评估三大模块。 sklearn是Scipy的扩展,建立在NumPy和matplotl ...
分类:
其他好文 时间:
2016-08-11 00:56:07
阅读次数:
367
matplotlib是强大的python 绘图包。pandas 是强大的python分析工具包。numpy是强大的python统计包。 都超级好用,而且最近开始动手实践机器学习算法了。特此备注一下安装过程: ----------------------------------------- 1. m ...
分类:
其他好文 时间:
2016-08-08 20:58:37
阅读次数:
567
一、概述 当做重要决定时,大家可能都会考虑吸取多个专家而不只是一个人的意见。机器学习处理问题时又何尝不是如此?这就是元算法(meta-algorithm)背后的思路。元算法是对其他算法进行组合的一种方式。接下来我们将集中关注一个称作AdaBoost的最流行的元算法。由于某些人认为AdaBoost是最 ...
分类:
编程语言 时间:
2016-08-04 15:02:11
阅读次数:
1779
概率论是许多机器学习算法的基础,所以深刻理解这一主题就显得十分重要。第3章在计算特征值取某个值的概率时涉及了一些概率知识,在那里我们先统计特征在数据集中取某个特定值的次数,然后除以数据集的实例总数,就得到了特征取该值的概率。也许你可以通过下列在Http请求头中来附加Token有时候在生活中,你需要一... ...
分类:
其他好文 时间:
2016-08-02 11:16:14
阅读次数:
112
一、概述 前两章我们要求分类器做出艰难决策,给出“该数据实例属于哪一类”这类问题的明确答案。不过,分类器有时会产生错误结果,这时可以要求分类器给出一个最优的类别猜测结果,同时给出这个猜测的概率估计值。 概率论是许多机器学习算法的基础,所以深刻理解这一主题就显得十分重要。第3章在计算特征值取某个值的概 ...
分类:
编程语言 时间:
2016-08-02 09:59:56
阅读次数:
396
机器学习算法( 二、K - 近邻算法) 一、概述 k-近邻算法采用测量不同特征值之间的距离方法进行分类。 工作原理:首先有一个样本数据集合(训练样本集),并且样本数据集合中每条数据都存在标签(分类),即我们知道样本数据中每一条数据与所属分类的对应关系,输入没有标签的数据之后,将新数据的每个特征与样本 ...
分类:
编程语言 时间:
2016-08-02 01:07:04
阅读次数:
375
监督学习KNNK近邻算法defclassify0(inX,dataSet,labels,k):dataSetSize=dataSet.shape[0]diffMat=tile(inX,(dataSetSize,1))-dataSetsqDiffMat=diffMat**2sqDistances=sqDiffMat.sum(axis=1)distances=sqDistances**0.5sortedDistIndicies=distances.argsort()classCount={}for..
分类:
编程语言 时间:
2016-08-01 23:25:40
阅读次数:
253
本节使用的算法称为ID3,另一个决策树构造算法CART以后讲解。 一、概述 我们经常使用决策树处理分类问题,它的过程类似二十个问题的游戏:参与游戏的一方在脑海里想某个事物,其他参与者向他提出问题,只允许提20个问 题,问题的答案也只能用对或错回答。问问题的人通过推断分解,逐步缩小带猜测事物的范围。 ...
分类:
编程语言 时间:
2016-08-01 17:16:35
阅读次数:
695
MLlib 是构建在 Spark 上的分布式机器学习库,充分利用了 Spark 的内存计算和适合迭代型计算的优势,将性能大幅度提升。同时由于 Spark 算子丰富的表现力, 让大规模机器学习的算法开发不再复杂。 MLlib 是 一 些 常 用 的 机 器 学 习 算 法 和 库 在Spark 平台上 ...
分类:
Web程序 时间:
2016-08-01 17:13:44
阅读次数:
257