> 微信公众号【黄小斜】大厂程序员,互联网行业新知,终身学习践行者。关注后回复「Java」、「Python」、「C++」、「大数据」、「机器学习」、「算法」、「AI」、「Android」、「前端」、「iOS」、「考研」、「BAT」、「校招」、「笔试」、「面试」、「面经」、「计算机基础」、「LeetC ...
分类:
编程语言 时间:
2019-08-16 22:36:06
阅读次数:
127
KNN算法原理 KNN(K-Nearest Neighbor)最邻近分类算法是数据挖掘分类(classification)技术中最简单的算法之一,其指导思想是”近朱者赤,近墨者黑“,即由你的邻居来推断出你的类别。 KNN最邻近分类算法的实现原理:为了判断未知样本的类别,以所有已知类别的样本作为参照, ...
分类:
编程语言 时间:
2019-08-16 00:52:58
阅读次数:
94
一、V1.0(sklearn版) 1.1简易API 1.2复杂API 目的是尽量全。 1.3API资料 目的是前面不满足使用或不太理解可以从这里获得灵感。 ...
分类:
编程语言 时间:
2019-08-13 20:52:08
阅读次数:
98
一、原理阐述 算法类型:监督学习_分类算法 输入:数值型或标称型(标称型需要独热编码) V1.0 用回归方式解决二分类问题,通过引入一个Sigmoid函数将中间y值映射到实际二分类的y值上。 二、算法选择 三、算法过程 1.Sigmoid函数是一个x值域是(-∞,+∞),y值域是(0,1)的单调递增 ...
分类:
编程语言 时间:
2019-08-13 20:12:20
阅读次数:
75
机器学习算法推导当中,有的时候能看到一个函数 ,这个函数代表什么意思? 代表的是指示函数(indicator function)。 它的含义是:当输入为True的时候,输出为1,输入为False的时候,输出为0。 例如: ,表示当 不等于 的时候输出为1,否则输出为0。 ...
分类:
其他好文 时间:
2019-08-11 17:33:50
阅读次数:
112
1基于CF的推荐算法 1.1算法简介 CF(协同过滤)简单来形容就是利用兴趣相投的原理进行推荐,协同过滤主要分两类,一类是基于物品的协同过滤算法,另一种是基于用户的协同过滤算法,这里主要介绍基于物品的协同过滤算法。 给定一批用户,及一批物品,记Vi表示不同用户对物品的评分向量,那么物品i与物品j的相 ...
分类:
编程语言 时间:
2019-08-11 11:19:56
阅读次数:
128
集成学习(ensemble learning)通过构建并结合多个学习器完成任务。也可称为多分类器系统(multi-classifier system)、基于委员会的学习(committee-based learning)等。其一般结构是先生成一组“个体学习器”(individual learner) ...
分类:
编程语言 时间:
2019-08-10 20:59:51
阅读次数:
97
主成分分析法 [TOC] 主成分分析法:(Principle Component Analysis, PCA),是一个非监督机器学习算法,主要用于数据降维,通过降维,可以发现便于人们理解的特征,其他应用:可视化和去噪等。 一、主成分分析的理解 ? 先假设用数据的两个特征画出散点图,如果我们只保留特征 ...
分类:
其他好文 时间:
2019-08-10 14:12:24
阅读次数:
99
梯度下降法 [TOC] 梯度下降法,是一种基于搜索的最优化方法,最用是最小化一个损失函数。 一、什么是梯度下降? ? 机器学习算法都需要最大化或最小化一个函数,这个函数被称为"目标函数",其中我们一般把最小化的一类函数,称为"损失函数"。它能根据预测结果,衡量出模型预测能力的好坏。在求损失函数最小化 ...
分类:
其他好文 时间:
2019-08-08 19:42:49
阅读次数:
125
本文主要回顾下几个常用算法的适应场景及其优缺点! 机器学习算法太多了,分类、回归、聚类、推荐、图像识别领域等等,要想找到一个合适算法真的不容易,所以在实际应用中,我们一般都是采用启发式学习方式来实验。通常最开始我们都会选择大家普遍认同的算法,诸如SVM,GBDT,Adaboost,现在深度学习很火热 ...
分类:
编程语言 时间:
2019-08-08 11:44:01
阅读次数:
129