定义K最近邻(k-NearestNeighbor,KNN)分类算法,是一个理论上比较成熟的方法,也是最简单的机器学习算法之一。该方法的思路是:如果一个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别,则该样本也属于这个类别。K近邻距离的计算在KNN中,通过计算对象间距离来作为各个对象之间的非相似性指标,距离一般使用欧氏距离或曼哈顿距离:
分类:
编程语言 时间:
2019-02-02 10:41:45
阅读次数:
190
面试问题总结。 问题:1. 自我介绍。2. 介绍了一下自己简历上的项目。3. SVM详细原理。4. Kmeans原理,何时停止迭代。 算法题:1. 一个随机整数产生器产生[1,5],如何设计一个产生[1,7]的随机整数产生器。解法:设k1,k2属于[1,5], 生成k3 = 5*(k1-1)+k2+ ...
分类:
编程语言 时间:
2019-01-29 20:27:31
阅读次数:
309
最近在看《机器学习实战》这本书,因为自己本身很想深入的了解机器学习算法,加之想学python,选择了这本书进行学习。 一 . K-近邻算法(KNN)概述 最简单最初级的分类器是将全部的训练数据所对应的类别都记录下来,当测试对象的属性和某个训练对象的属性完全匹配时,便可以对其进行分类。但是怎么可能所有 ...
分类:
编程语言 时间:
2019-01-28 14:04:19
阅读次数:
186
传统的机器学习任务从开始到建模的一般流程是:获取数据 -> 数据预处理 -> 训练建模 -> 模型评估 -> 预测,分类。本文我们将依据传统机器学习的流程,看看在每一步流程中都有哪些常用的函数以及它们的用法是怎么样的。希望你看完这篇文章可以最为快速的开始你的学习任务。 1. 获取数据 1.1 导入s ...
分类:
编程语言 时间:
2019-01-27 10:44:33
阅读次数:
223
参数是机器学习算法的关键。它们通常由过去的训练数据中总结得出。在经典的机器学习文献中,我们可以将模型看作假设,将参数视为对特定数据集的量身打造的假设。 模型是否具有固定或可变数量的参数决定了它是否可以被称为“参数”或“非参数”。 模型参数是根据数据自动估算的。但模型超参数是手动设置的,并且在过程中用 ...
分类:
其他好文 时间:
2019-01-23 01:27:52
阅读次数:
215
因为自己想学着去写机器学习的源码,所以我最近在学习《机器学习实战》这本书。 《机器学习实战》是利用Python2完成的机器学习算法的源代码,并利用机器学习方法来对实际问题进行分析与处理。 (《机器学习实战》豆瓣读书网址:https://book.douban.com/subject/24703171 ...
分类:
编程语言 时间:
2019-01-18 01:00:42
阅读次数:
163
什么是机器学习 机器学习是人工智能的一个分支。人工智能的研究是从以“推理”为重点到以“知识”为重点,再到以“学习”为重点,一条自然、清晰的脉络。机器学习是实现人工智能的一个途径,即以机器学习为手段解决人工智能中的问题。机器学习算法是一类从数据中自动分析获得规律(模型),并利用规律对未知数据进行预测的 ...
分类:
其他好文 时间:
2019-01-17 22:37:05
阅读次数:
173
2019-01-17 18:18:42 第一次写博客,记录一下。 为什么写博客? 主要是想记录一下自己的学习生活之类的吧。上一次写类似的东西还要追溯到高中吧,那时候QQ空间好像很火,我自己写了20多篇文章,时不时回忆一下高中的生活。说实话,高中应该是人生中最美好的一段时期吧。想想那个时候的主要矛盾还 ...
分类:
其他好文 时间:
2019-01-17 21:11:32
阅读次数:
160
Q:什么是“深度学习” 对于“深度学习”这个术语,一个粗浅的定义是“ 主要使用深度神经网络为工具的机器学习算法 ”。深度学习首先是一类机器学习的方法,因为它和其他机器学习方法一样允许计算机从样本中、从实例中、从数据中使用统计手段“ 学习 ”出规律来,而不用像专家系统和其他 "符号主义" 的方法一样人 ...
分类:
其他好文 时间:
2019-01-13 22:22:35
阅读次数:
317
多分类问题优先选择SVM,随机森林,其次是逻辑回归。 朴素贝叶斯和线性回归都是比较简单的模型,对于数据的要求比较高,功能不是特别强大。 1、决策树 不需要对数据做任何预处理, 2、随机森林 3、数据预处理与特征工程 (1)数据预处理:只需要X 数据无量钢化:标准化(转化为正态分布)、归一化(不改变数 ...
分类:
编程语言 时间:
2019-01-13 16:08:38
阅读次数:
312