1.前言:为什么我们要关心模型的bias和variance? 大家平常在使用机器学习算法训练模型时,都会划分出测试集,用来测试模型的准确率,以此评估训练出模型的好坏。但是,仅在一份测试集上测试,存在偶然性,测试结果不一定准确。那怎样才能更加客观准确的评估模型呢,很简单,多用几份测试数据进行测试,取多 ...
分类:
其他好文 时间:
2018-09-07 17:59:18
阅读次数:
638
1、请计算数组[1,2,3]中的元素3的Softmax值 假设我们有一个数组,V,Vi表示V中的第i个元素,那么这个元素的Softmax值就是 也就是说,是该元素的指数,与所有元素指数和的比值 2、什么是过拟合? 防止过拟合有哪些措施? 3、对于二分类问题,分别描述逻辑回归、朴素贝叶斯、KNN算法。 ...
分类:
其他好文 时间:
2018-09-02 11:08:46
阅读次数:
348
"练习使用的数据 diabetes.csv" "备用百度网盘地址" 导入要用到的包 输出要被分类的特征列,柱状图可能更加直观 KNN 模型准确率的折线图 线性逻辑回归 准确率的打印以及 图形展示 ...
分类:
其他好文 时间:
2018-08-29 16:56:40
阅读次数:
232
基于python实现的KNN算法 邻近算法(k-NearestNeighbor) 是机器学习中的一种分类(classification)算法,也是机器学习中最简单的算法之一了。虽然很简单,但在解决特定问题时却能发挥很好的效果。因此,学习kNN算法是机器学习入门的一个很好的途径。 kNN算法的思想非常 ...
分类:
编程语言 时间:
2018-08-27 21:51:52
阅读次数:
227
在开始kNN博文之前,举一个小栗子。当手中的杯子突然滑落,从一米多高的空中坠向地板,常人会惊慌失措,心想:坏了,要碎了!这一下意识的想法,恰恰说明了kNN运作的机理:没有人在此之前见过那只特定的杯子打碎的样子, 但是大家见过很多其他杯子打碎的样子,以及很多杯子虽然摔落但没有碎掉的例子。所以我们知道, ...
分类:
其他好文 时间:
2018-08-26 23:42:13
阅读次数:
201
判别模型和生成模型:统计学派和贝叶斯学派之争 判别模型: 直接对输入空间到输出空间的映射h(x)做预测,或者直接对条件概率分布P(y|x)做预测 PM,SVM,NN,KNN,LR,DT 模型一般更准确 不需要预设条件 鲁棒性更高 生成模型: 先对概率分布P(x,y)做预测,根据贝叶斯公式得到P(y| ...
分类:
其他好文 时间:
2018-08-26 13:48:12
阅读次数:
174
六、网格搜索与 K 邻近算法中更多的超参数 七、数据归一化 Feature Scaling 解决方案:将所有的数据映射到同一尺度 八、scikit-learn 中的 Scaler preprocessing.py 九、更多有关 K 近邻算法的思考 优点: 解决分类问题 天然可以解决多分类问题 思想简 ...
分类:
编程语言 时间:
2018-08-25 20:07:22
阅读次数:
141
一、K近邻算法基础 KNN K近邻算法 K-Nearest Neighbors 思想极度简单 应用数学知识少 (近乎为零) 效果好(缺点?) 可以解释机器学习算法使用过程中很多细节问题 更完整的刻画机器学习应用的流程 kNN的过程 二、scikit-learn 中的机器学习算法封装KNN/KNNN. ...
分类:
编程语言 时间:
2018-08-25 13:57:39
阅读次数:
268
1. KNN分类算法原理及应用 1.1 KNN概述 K最近邻(k-Nearest Neighbor,KNN)分类算法是最简单的机器学习算法。 KNN算法的指导思想是“近朱者赤,近墨者黑”,由你的邻居来推断你的类型。 本质上,KNN算法就是用距离来衡量样本之间的相似度。 1.2 算法图示 从训练集中找 ...
分类:
编程语言 时间:
2018-08-24 18:11:09
阅读次数:
220