PCA对手写数字数据集的降维 还记得我们上一周在讲特征工程时,使用的手写数字的数据集吗?数据集结构为(42000, 784),用KNN跑一次半小时,得到准确率在96.6%上下,用随机森林跑一次12秒,准确率在93.8%,虽然KNN效果好,但由于数据量太大,KNN计算太缓慢,所以我们不得不选用随机森林 ...
分类:
编程语言 时间:
2021-06-28 18:03:47
阅读次数:
0
1 PCA参数列表 2 PCA属性列表 3 PCA接口列表 ...
分类:
编程语言 时间:
2021-06-28 18:03:27
阅读次数:
0
系列文章目录: 感知机 线性回归 非线性问题 多项式回归 岭回归 逻辑回归 算法介绍 今天我们一起来学习使用非常广泛的分类算法:逻辑回归,是的,你没有看错,虽然它名字里有回归,但是它确实是个分类算法,作为除了感知机以外,最最最简单的分类算法,下面我们把它与感知机对比来进行学习; 从决策边界上看 感知 ...
分类:
编程语言 时间:
2021-06-24 18:35:36
阅读次数:
0
一、简介 1 蚁群算法的提出 蚁群算法(ant colony optimization, ACO),又称蚂蚁算法,是一种用来寻找优化路径的机率型算法。它由Marco Dorigo于1992年在他的博士论文中提出,其灵感来源于蚂蚁在寻找食物过程中发现路径的行为。遗传算法在模式识别、神经网络、机器学习、 ...
分类:
编程语言 时间:
2021-06-24 17:59:46
阅读次数:
0
1 概述 1.1 决策树是如何工作的 决策树(Decision Tree)是一种非参数的有监督学习方法,它能够从一系列有特征和标签的数据中总结出决策规则,并用树状图的结构来呈现这些规则,以解决分类和回归问题。决策树算法容易理解,适用各种数据,在解决各种问题时都有良好表现,尤其是以树模型为核心的各种集 ...
分类:
编程语言 时间:
2021-06-23 16:38:22
阅读次数:
0
记一次不小心搞坏了前几天已经解决掉的 ie 兼容问题, 简直要疯, 因为明天就要用!!! 就随便写点吧, 因为焦作和痛苦了几小时, 后面还有一大堆重要事呢(mockm 更新的版本貌似出问题了, 已有百来个人更新了此版本, 论回归测试的重要性). 本来之前花了两天解决了 ie 的兼容问题, 提交了代码 ...
分类:
其他好文 时间:
2021-06-21 20:01:36
阅读次数:
0
计算交叉验证的指标 使用交叉验证最简单的方法是在估计器和数据集上调用 cross_val_score 辅助函数。 下面的示例展示了如何通过分割数据,拟合模型和计算连续 5 次的分数(每次不同分割)来估计 linear kernel 支持向量机在 iris 数据集上的精度: >>> from skle ...
分类:
其他好文 时间:
2021-06-20 17:46:16
阅读次数:
0
1. 准确的PCA和概率解释(Exact PCA and probabilistic interpretation) PCA 用于对具有一组连续正交分量(Orthogonal component 译注: 或译为正交成分,下出现 成分 和 分量 是同意词)的多变量数据集进行方差最大化的分解。 在 sc ...
分类:
其他好文 时间:
2021-06-20 17:35:34
阅读次数:
0
有两种类型的转换是可用的:分位数转换和幂函数转换。分位数和幂变换都基于特征的单调变换,从而保持了每个特征值的秩。 通过执行秩变换,分位数变换平滑了异常分布,并且比缩放方法受异常值的影响更小。但是它的确使特征间及特征内的关联和距离失真了。 幂变换则是一组参数变换,其目的是将数据从任意分布映射到接近高斯 ...
分类:
其他好文 时间:
2021-06-19 19:31:43
阅读次数:
0
线性回归 房价预测 跟着李沐的动手学深度学习,跟着写了一遍房价预测的处理和预测,加了一些注释,同时稍微改动了一些地方 import hashlib import os import tarfile import zipfile import requests DATA_HUB = dict() DA ...
分类:
其他好文 时间:
2021-06-19 18:54:00
阅读次数:
0