对于机器学习的实际运用。光停留在知道了解的层面还不够,我们须要对实际中easy遇到的一些问题进行深入的挖掘理解。我打算将一些琐碎的知识点做一个整理。 1 数据不平衡问题 这个问题是经常遇到的。就拿有监督的学习的二分类问题来说吧。我们须要正例和负例样本的标注。假设我们拿到的训练数据正例非常少负例非常多 ...
分类:
编程语言 时间:
2018-03-23 19:23:56
阅读次数:
283
1、集成学习概述 1.1 集成学习概述 集成学习在机器学习算法中具有较高的准去率,不足之处就是模型的训练过程可能比较复杂,效率不是很高。目前接触较多的集成学习主要有2种:基于Boosting的和基于Bagging,前者的代表算法有Adaboost、GBDT、XGBOOST、后者的代表算法主要是随机森 ...
分类:
编程语言 时间:
2018-03-21 16:36:00
阅读次数:
194
十五、异常检测(Anomaly Detection) 15.1 问题的动机 参考文档: 15 - 1 - Problem Motivation (8 min).mkv 在接下来的一系列视频中,我将向大家介绍异常检测(Anomaly detection)问题。这是机 器学习算法的一个常见应用。这种算法 ...
分类:
其他好文 时间:
2018-03-19 13:34:55
阅读次数:
154
集成学习 Ensemble learning 中文名叫做集成学习,它并不是一个单独的机器学习算法,而是将很多的机器学习算法结合在一起,我们把组成集成学习的算法叫做“个体学习器”。在集成学习器当中,个体学习器都相同,那么这些个体学习器可以叫做“基学习器”。 个体学习器组合在一起形成的集成学习,常常能够 ...
分类:
其他好文 时间:
2018-03-13 22:50:51
阅读次数:
590
Python机器学习简介 第一章 让计算机从数据中学习 将数据转化为知识 三类机器学习算法 第二章 训练机器学习分类算法 透过人工神经元一窥早期机器学习历史 使用Python实现感知机算法 基于Iris数据集训练感知机模型 自适应线性神经元及收敛问题 Python实现自适应线性神经元 大规模机器学习... ...
分类:
编程语言 时间:
2018-03-12 01:05:23
阅读次数:
206
Python机器学习简介 第一章 让计算机从数据中学习 将数据转化为知识 三类机器学习算法 第二章 训练机器学习分类算法 透过人工神经元一窥早期机器学习历史 使用Python实现感知机算法 基于Iris... ...
分类:
编程语言 时间:
2018-03-12 01:03:28
阅读次数:
144
许多机器学习算法都有一个假设:输入数据要是线性可分的。感知机算法必须针对完全线性可分数据才能收敛。考虑到噪音,Adalien、逻辑斯蒂回归和SVM并不会要求数据完全线性可分。
但是现实生活中有大量的非线性数据,此时用于降维的线性转换手段比如PCA和LDA效果就不会太好。这一节我们学习PCA的核化版... ...
分类:
编程语言 时间:
2018-03-12 00:05:32
阅读次数:
366
机器学习算法简单入门。 由于团队(大数据团队)技术发展需要,借对交通业务数据进行需求拓展,实现数据挖掘和数据分析技术的掌握,绕不开机器学习算法,可以说,大数据的核心价值在于算法。 如下图,当前机器学习按照任务类型可以分为有监督学习和无监督学习,这两者的区别在于你是否告诉程序一个标签,或者叫答案,一个 ...
分类:
编程语言 时间:
2018-03-07 23:59:41
阅读次数:
306
线性回归 训练模型表示通过有标签样本来学习(确定)所有权重和偏差的理想值。在监督式学习中,机器学习算法通过以下方式构建模型:检查多个样本并尝试找出可最大限度地减少损失的模型;这一过程称为经验风险最小化。 均方误差 (MSE) 指的是每个样本的平均平方损失。要计算 MSE,请求出各个样本的所有平方损失 ...
分类:
其他好文 时间:
2018-03-07 00:58:51
阅读次数:
162
作者:tornadomeet 出处:http://www.cnblogs.com/tornadomeet 欢迎转载或分享。但请务必声明文章出处。 (新浪微博:tornadomeet,欢迎交流!) 前言: 找工作时(IT行业),除了常见的软件开发以外,机器学习岗位也能够当作是一个选择,不少计算机方向的 ...
分类:
编程语言 时间:
2018-03-04 19:57:28
阅读次数:
135