一、简介 1 蚁群算法的提出 蚁群算法(ant colony optimization, ACO),又称蚂蚁算法,是一种用来寻找优化路径的机率型算法。它由Marco Dorigo于1992年在他的博士论文中提出,其灵感来源于蚂蚁在寻找食物过程中发现路径的行为。遗传算法在模式识别、神经网络、机器学习、 ...
分类:
编程语言 时间:
2021-06-24 17:59:46
阅读次数:
0
1 概述 1.1 决策树是如何工作的 决策树(Decision Tree)是一种非参数的有监督学习方法,它能够从一系列有特征和标签的数据中总结出决策规则,并用树状图的结构来呈现这些规则,以解决分类和回归问题。决策树算法容易理解,适用各种数据,在解决各种问题时都有良好表现,尤其是以树模型为核心的各种集 ...
分类:
编程语言 时间:
2021-06-23 16:38:22
阅读次数:
0
计算交叉验证的指标 使用交叉验证最简单的方法是在估计器和数据集上调用 cross_val_score 辅助函数。 下面的示例展示了如何通过分割数据,拟合模型和计算连续 5 次的分数(每次不同分割)来估计 linear kernel 支持向量机在 iris 数据集上的精度: >>> from skle ...
分类:
其他好文 时间:
2021-06-20 17:46:16
阅读次数:
0
1. 准确的PCA和概率解释(Exact PCA and probabilistic interpretation) PCA 用于对具有一组连续正交分量(Orthogonal component 译注: 或译为正交成分,下出现 成分 和 分量 是同意词)的多变量数据集进行方差最大化的分解。 在 sc ...
分类:
其他好文 时间:
2021-06-20 17:35:34
阅读次数:
0
有两种类型的转换是可用的:分位数转换和幂函数转换。分位数和幂变换都基于特征的单调变换,从而保持了每个特征值的秩。 通过执行秩变换,分位数变换平滑了异常分布,并且比缩放方法受异常值的影响更小。但是它的确使特征间及特征内的关联和距离失真了。 幂变换则是一组参数变换,其目的是将数据从任意分布映射到接近高斯 ...
分类:
其他好文 时间:
2021-06-19 19:31:43
阅读次数:
0
简介: 最佳实践,以DLA为例子。DLA致力于帮助客户构建低成本、简单易用、弹性的数据平台,比传统Hadoop至少节约50%的成本。其中DLA Meta支持云上15+种数据数据源(OSS、HDFS、DB、DW)的统一视图,引入多租户、元数据发现,追求边际成本为0,免费提供使用。DLA Lakehou ...
分类:
其他好文 时间:
2021-06-18 20:06:29
阅读次数:
0
1 Hoeffding不等式 Hoeffding不等式是非常有用的一个不等式,在机器学习、统计学等领域,都发挥着巨大的作用。 它的思想与Markov不等式有些类似,我们先给出它的形式: Hoeffding不等式:$Y_1,\ldots,Y_n$为独立观测,\(E(Y_i)=0\),\(a_i\leq ...
分类:
其他好文 时间:
2021-06-15 17:41:59
阅读次数:
0
56层只要把前20层参数河这个20层的参数一样,后面36层就什么都不做,只复制前一层的输出就好;所以56层一定可以做大20层的network做的事情;56层比20层的弹性更大,多以没有道理做的没有20层的好。所以此处不是overfitting,也不是model bias,因为56层network弹性 ...
分类:
其他好文 时间:
2021-06-13 10:19:25
阅读次数:
0
师兄的博客,毕业了他没维护了,我转过来。原文地址 "https://blog.csdn.net/LogHouse/article/details/90550608" @ "TOC" 基础知识至线性回归 从头学习周志华版的机器学习,同时准备使用Python实现一些相关的方法,以 ...
分类:
其他好文 时间:
2021-06-11 17:37:36
阅读次数:
0
师兄博客原文地址 "https://blog.csdn.net/LogHouse/article/details/90734048" @ "TOC" 线性模型及多分类 承接上一篇,线性模型的部分内容已经讲过了,这篇主要讲剩下的内容,对应周志华《机器学习》第三章的大部分。 一些 ...
分类:
其他好文 时间:
2021-06-11 17:34:08
阅读次数:
0