参考机器学习实战第二章K邻近算法的数据分析一小节,稍微修改了一下条件,准备拿去给蓝盆友做提醒。 可以看出,玩游戏少,看视频率低,并且爱干净的男生更受欢迎哈。 ...
分类:
其他好文 时间:
2017-12-16 17:09:13
阅读次数:
103
参考链接http://blog.csdn.net/lu597203933/article/details/38468303 ...
分类:
其他好文 时间:
2017-12-16 11:13:04
阅读次数:
175
支持向量机SVM(Support vector machine)是一种二值分类器方法,其基本是思想是:找到一个能够将两类分开的线性可分的直线(或者超平面)。实际上有许多条直线(或超平面)可以将两类目标分开来,我们要找的其实是这些直线(或超平面)中分割两类目标时,有最大距离的直线(或超平面)。我们称这... ...
分类:
其他好文 时间:
2017-12-02 19:12:25
阅读次数:
402
写在前面:这一个多月都在学习python,从python3基础、python爬虫、python数据挖掘与数据分析都有接触,最近看到一本机器学习的书(主要是学习相关算法) 于是就打算来做这份机器学习的笔记,笔记主要来源是《机器学习实战》以及网上一些博客资料和自己的理解,主要做我个人学习所用,初学者水平 ...
分类:
编程语言 时间:
2017-11-27 20:04:09
阅读次数:
177
聚类是一种无监督的学习,它将相似的对象归到同一个簇中。它有点像全自动分类。聚类方法几乎可以应用于所有对象,簇内的对象越相似,聚类的效果越好 簇识别给出聚类结果的含义。假定有一些数据,现在将相似数据归到一起,簇识别会告诉我们这些簇到底都是些什么。聚类与分类的最大不同在于,分类的目标事先巳知,而聚类则不 ...
分类:
编程语言 时间:
2017-11-21 01:19:28
阅读次数:
289
Output: The error rate is: 0.1 背景:为什么要做平滑处理? 零概率问题,就是在计算实例的概率时,如果某个量x,在观察样本库(训练集)中没有出现过,会导致整个实例的概率结果是0。在文本分类的问题中,当一个词语没有在训练样本中出现,该词语调概率为0,使用连乘计算文本出现概率 ...
分类:
编程语言 时间:
2017-11-19 17:25:21
阅读次数:
162
8. 1 用线性回归找到最佳拟合直线 线性回归 优点:结果易于理解,计算上不复杂。 缺点:对非线性的数据拟合不好。 适用数据类型:数值型和标称型数据。 回归的目的是预测数值型的目标值。最直接的办法是依据输人写出一个目标值的计算公式。 假如你想要预测姐姐男友汽车的功率大小,可能会这么计算: Horse ...
分类:
其他好文 时间:
2017-11-17 18:26:41
阅读次数:
303
做重要决定时,大家可能都会考虑吸取多个专家而不只是一个人的意见。机器学习处理问题时又何尝不是如此?这就是元算法(meta-algorithm ) 背后的思路。元算法是对其他算法进行组合的一种方式 7.1 基于数据集多重抽样的分类器 我们自然可以将不同的分类器组合起来,而这种组合结果则被称为集成方法( ...
分类:
编程语言 时间:
2017-11-15 22:00:02
阅读次数:
326
学习《机器学习实战》第2章 参考博客:http://blog.csdn.net/c406495762/article/details/75172850#三-k-近邻算法实战之sklearn手写数字识别 K近邻法(k-nearest neighbor,K-NN)采用测量不同特征值之间的距离方法进行分类 ...
分类:
其他好文 时间:
2017-11-14 21:19:35
阅读次数:
242