K-近邻算法(K Nearest Neighbors) 参考:机器学习实战教程(一):K-近邻算法(史诗级干货长文) 决策树算法(Decision Tree) 参考:机器学习实战教程(二):决策树基础篇之让我们从相亲说起 参考:机器学习实战教程(三):决策树实战篇之为自己配个隐形眼镜 朴素贝叶斯算法 ...
分类:
编程语言 时间:
2019-01-26 15:55:25
阅读次数:
191
先扯一下大数据的4V特征: 数据量大,TB->PB 数据类型繁多,结构化、非结构化文本、日志、视频、图片、地理位置等; 商业价值高,但是这种价值需要在海量数据之上,通过数据分析与机器学习更快速的挖掘出来; 处理时效性高,海量数据的处理需求不再局限在离线计算当中。 现如今,正式为了应对大数据的这几个特 ...
分类:
其他好文 时间:
2019-01-22 10:57:06
阅读次数:
256
因为自己想学着去写机器学习的源码,所以我最近在学习《机器学习实战》这本书。 《机器学习实战》是利用Python2完成的机器学习算法的源代码,并利用机器学习方法来对实际问题进行分析与处理。 (《机器学习实战》豆瓣读书网址:https://book.douban.com/subject/24703171 ...
分类:
编程语言 时间:
2019-01-18 01:00:42
阅读次数:
163
原文链接: Jack Cui,https://cuijiahua.com/blog/2017/11/ml_5_bayes_2.html 一、前言 上篇文章机器学习实战教程(四):朴素贝叶斯基础篇之言论过滤器讲解了朴素贝叶斯的基础知识。本篇文章将在此基础上进行扩展,你将看到以下内容: 拉普拉斯平滑 垃 ...
分类:
其他好文 时间:
2019-01-12 12:05:40
阅读次数:
236
原文链接: Jack Cui,https://cuijiahua.com/blog/2017/11/ml_4_bayes_1.html 一、前言 朴素贝叶斯算法是有监督的学习算法,解决的是分类问题,如客户是否流失、是否值得投资、信用等级评定等多分类问题。该算法的优点在于简单易懂、学习效率高、在某些领 ...
分类:
其他好文 时间:
2019-01-12 12:03:56
阅读次数:
183
由于实验室研究方向变更,本文不再更新~ 本文是对《机器学习实战》进行学习时遇到问题记录。 由于书中代码使用Python2.X,而本机使用Python3.X,导致运行时有部分程序出现错误。 问题1: 问题位置: 3.2 在Python中使用Matplotlib注解绘制树形图(P45)——程序清单3-6 ...
分类:
其他好文 时间:
2019-01-04 17:18:31
阅读次数:
198
Logistic回归一、概述 1. Logistic Regression 1.1 线性回归 1.2 Sigmoid函数 1.3 逻辑回归 1.4 LR 与线性回归的区别 2. LR的损失函数 3. LR 正则化 3.1 L1 正则化 3.2 L2 正则化 3.3 L1正则化和L2正则化的区别 4. ...
分类:
其他好文 时间:
2018-12-31 22:44:04
阅读次数:
265
原文链接:www.cnblogs.com/fydeblog/p/7140974.html 前言 这篇notebook是关于机器学习中监督学习的k近邻算法,将介绍2个实例,分别是使用k 近邻算法改进约会网站的效果和手写识别系统. 操作系统:ubuntu14.04 运行环境:anaconda pytho ...
分类:
编程语言 时间:
2018-12-25 23:34:49
阅读次数:
294
逻辑回归:简单的来说,在线性回归的基础上加入了Sigmoid函数! ...
分类:
其他好文 时间:
2018-12-23 00:19:19
阅读次数:
165
老板:来了,老弟! 我:来了来了。 老板:今天你要去看看KNN了,然后我给你安排一个工作! 我:好嘞!就是第二章吗? 老板:对!去吧! 可恶的老板又给我安排任务了! 《机器学习实战》这本书中的第二章为我们介绍了 K 近邻算法 ,这是本书中第一个机器学习算法,它非常有效而且易于掌握,所以可以算是入门级 ...
分类:
编程语言 时间:
2018-12-22 20:44:48
阅读次数:
294