目录 简述 梯度下降与梯度上升 梯度下降法算法详解 梯度下降法大家族(BGD,SGD,MBGD) 梯度下降法和其他无约束优化算法的比较 总结 在求解机器学习算法的模型参数,即无约束优化问题时,梯度下降(Gradient Descent)是最常采用的方法之一,另一种常用的方法是最小二乘法(在【2】中已... ...
分类:
其他好文 时间:
2020-02-23 21:50:51
阅读次数:
65
【机器学习】算法原理详细推导与实现(六):k means算法 之前几个章节都是介绍有监督学习,这个章节介绍无监督学习,这是一个被称为 的聚类算法,也叫做 k均值聚类算法 。 聚类算法 在讲监督学习的时候,通常会画这样一张图: 这时候需要用 回归或者 将这些数据分成正负两类,这个过程称之为 监督学习 ...
分类:
编程语言 时间:
2020-02-23 11:14:20
阅读次数:
85
高斯混合模型 本博客根据 百面机器学习,算法工程师带你去面试 一书总结归纳,公式图片均出自该书. 本博客仅为个人总结学习,非商业用途,侵删. 网址 http://www.ptpress.com.cn 高斯混合模型(Gaussian Mixed Model, GMM) 是一种常见的聚类算法,与K均值算 ...
分类:
其他好文 时间:
2020-02-20 18:38:49
阅读次数:
97
1 sklearn简介 Scikit learn(sklearn)是机器学习中的第三方模块,封装了常用的机器学习算法,涉及回归、降维、分类以及聚类等,提供python接口。 虽然sklearn容纳的算法众多,但使用其中大多数算法的模式(套路)都是一样的,一般流程如下: 1 引入相关数据(包括训练集与 ...
分类:
其他好文 时间:
2020-02-19 21:14:14
阅读次数:
78
降维,线性判别分析 本博客根据 百面机器学习,算法工程师带你去面试 一书总结归纳,公式都是出自该书. 本博客仅为个人总结学习,非商业用途,侵删. 网址 http://www.ptpress.com.cn 目录 LDA推导 LDA扩展到多维度 PCA与LDA的区别 LDA原理 线性判别分析(Linea ...
分类:
其他好文 时间:
2020-02-18 18:31:29
阅读次数:
82
本篇文章是原文的译文,然后自己对其中做了一些修改和添加内容(随机森林和降维算法)。文章简洁地介绍了机器学习的主要算法和一些伪代码,对于初学者有很大帮助,是一篇不错的总结文章,后期可以通过文中提到的算法展开去做一些实际问题。Google的自驾车和机器人得到了很多新闻,但公司的真正未来是机器学习,这种技... ...
分类:
编程语言 时间:
2020-02-18 16:39:58
阅读次数:
110
包含:经典机器学习、深度学习、强化学习、计算机视觉、分布式训练、自动建模、平台 1 . 适用于经典机器学习的工具 一、SciKit-learn star 39.2k fork 19.2k scikit-learn 是一种强大的基于 Python 语言的机器学习算法库(https://scikit-l ...
分类:
其他好文 时间:
2020-02-12 22:32:06
阅读次数:
114
Hadoop和Apache Spark究竟有什么异同。 解决问题的层面不一样 首先,Hadoop和Apache Spark两者都是大数据框架,但是各自存在的目的不尽相同。Hadoop实质上更多是一个分布式数据基础设施: 它将巨大的数据集分派到一个由普通计算机组成的集群中的多个节点进行存储,意味着您不 ...
分类:
其他好文 时间:
2020-02-12 00:20:53
阅读次数:
86
入行机器学习有一年多了,做过大大小小的机器学习项目,参加数据竞赛等实践活动,从最初的懵懵懂懂到现在逐步的深入,也渐渐的有了很多的体会和理解,本篇文章主要来阐述机器学习的知识体系,以让更多人明白机器学习应该怎样学习、需要学习什么?这些问题就是本篇文章的主要讨论的内容,下面开始进行详细介绍。 先对本篇文 ...
分类:
编程语言 时间:
2020-02-10 12:10:22
阅读次数:
88
K 近邻算法 作用:分类算法 优点:最简单、不需要训练、容易理解 缺点:计算复杂度高、空间复杂度高 原理:计算新数据与样本集中所有数据的欧式距离,提取距离最近的 K 个样本的标签,取 K 个样本里出现次数最多的标签,作为新数据的分类标签 决策树 ID3 作用:分类算法 优点:计算复杂度不高、容易理解 ...
分类:
编程语言 时间:
2020-02-09 09:54:44
阅读次数:
61