第八部分内容: 1.正则化Regularization 2.在线学习(Online Learning) 3.ML 经验 1.正则化Regularization 1.1通俗解释 引用知乎作者:刑无刀 解释之前,先说明这样做的目的:如果一个模型我们只打算对现有数据用一次就不再用了,那么正则化没必要了,因 ...
分类:
其他好文 时间:
2017-11-04 11:14:33
阅读次数:
169
第六部分内容: 1.偏差/方差(Bias/variance) 2.经验风险最小化(Empirical Risk Minization,ERM) 3.联合界(Union bound) 4.一致收敛(Uniform Convergence) ...
分类:
其他好文 时间:
2017-11-04 00:17:29
阅读次数:
145
第四部分: 1.生成学习法 generate learning algorithm 2.高斯判别分析 Gaussian Discriminant Analysis 3.朴素贝叶斯 Navie Bayes 4.拉普拉斯平滑 Navie Bayes 生成学习法: ...
分类:
其他好文 时间:
2017-11-01 14:59:24
阅读次数:
154
VectorIndexer: 倘若所有特征都已经被组织在一个向量中,又想对其中某些单个分量进行处理时,Spark ML提供了VectorIndexer类来解决向量数据集中的类别性特征转换。 通过为其提供maxCategories超参数,它可以自动识别哪些特征是类别型的,并且将原始值转换为类别索引。它 ...
分类:
其他好文 时间:
2017-10-31 22:19:51
阅读次数:
196
Python机器学习实战教程分享网盘地址——https://pan.baidu.com/s/1miIb4og密码:wtiw课程真心不错,分享给大家机器学习(MachineLearning,ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为..
分类:
编程语言 时间:
2017-10-30 14:48:53
阅读次数:
197
1.Used Libraries, Datasets, and Models 1.1 Libraries 1.2 Datasets 1.3 Models Structure 1.3 Available pre-trained model 2. TensorFlow Tips 2.1 Using GP ...
分类:
其他好文 时间:
2017-10-30 14:29:30
阅读次数:
272
package Spark_MLlib import org.apache.spark.ml.feature.Word2Vec import org.apache.spark.sql.SparkSession object 特征抽取_Word2Vec { val spark=SparkSession... ...
分类:
其他好文 时间:
2017-10-28 15:39:22
阅读次数:
387
判别分析(discriminant analysis)是一种分类技术。它通过一个已知类别的“训练样本”来建立判别准则,并通过预测变量来为未知类别的数据进行分类。判别分析的方法大体上有三类,即Fisher判别、Bayes判别和距离判别。 Fisher判别思想是投影降维,使多维问题简化为一维问题来处理。 ...
分类:
编程语言 时间:
2017-10-28 11:13:35
阅读次数:
206
一、概述 一元形式: 多元形式: 最小二乘的目标函数 ...
分类:
其他好文 时间:
2017-10-27 13:39:01
阅读次数:
94
一、概述 决策树的一个重要任务是为了数据中所蕴含的知识信息,因此决策树可以使用不熟悉的数据集合,并从中提取出一系列规则,在这些机器根据数据创建规则时,就是机器学习的过程。 二、决策树的构造 决策树: 优点:计算复杂度不高, 输出结果易于理解, 对中间值的缺失不敏感, 可以处理不相关特征数据。 缺点: ...
分类:
编程语言 时间:
2017-10-26 18:59:35
阅读次数:
132