机器学习中的统计学方法。 统计学是机器学习的一个支柱。 统计学是机器学习的一个支柱。 原始观察仅仅是数据, 但它们不是信息或知识。数据引发问题, 例如: 什么是最常见的或预期的观察? 观察的限制是什么? 数据是什么样子的? 什么是最常见的或预期的观察? 观察的限制是什么? 数据是什么样子的? 什么是 ...
分类:
系统相关 时间:
2018-05-25 14:01:48
阅读次数:
767
本文基于《Spark 高级数据分析》第2章 用Scala和Spark进行数据分析。 完整代码见 "" 1.获取数据集 数据集来自加州大学欧文分校机器学习资料库(UC Irvine Machine Learning Repository),这个资料库为研究和教学提供了大量非常好的数据源, 这些数据源非 ...
分类:
其他好文 时间:
2018-05-24 16:32:23
阅读次数:
2477
@(131 Machine Learning | 机器学习) Dummy Variable 虚拟变量的含义 虚拟变量又称虚设变量、名义变量或哑变量,用以反映质的属性的一个人工变量,是量化了的质变量,通常取值为0或1。引入哑变量可使线形回归模型变得更复杂,但对问题描述更简明,一个方程能达到俩个方程的作 ...
分类:
其他好文 时间:
2018-05-21 12:35:38
阅读次数:
301
ONE-CLASS DETECTION OF CELL STATES IN TUMOR SUBTYPES Machine Learning Identifies Stemness Features Associated with Oncogenic Dedifferentiation PanCanS ...
分类:
其他好文 时间:
2018-05-19 15:44:38
阅读次数:
856
其实今天只花了一点点时间来学习这本书, overfitting可以通过regularization来解决,贝叶斯方法也可以避免overfitting的出现,实际上在贝叶斯模型里,模型的有效参数数量会自动地根据训练数据集大小来确定。 regularization的思想是,对误差函数加入惩罚项,使得系数 ...
分类:
系统相关 时间:
2018-05-17 22:03:55
阅读次数:
182
Note This personal note is written after studying the opening course on "the coursera website" , "Machine Learning by Andrew NG" . And images, audios ...
分类:
其他好文 时间:
2018-05-13 00:36:44
阅读次数:
271
Title: Estimating aboveground biomass of a mangrove plantation on the Northern coast of Vietnam using machine learning techniques with an integration ...
分类:
其他好文 时间:
2018-05-11 12:59:19
阅读次数:
141
参考资料 <PYTHON_MACHINE_LEARNING> chapter3 A Tour of Machine Learning Classifers Using Scikit-learn 引言 在我们进行分类的时,所取样本中的特征值一般都分布在实数域,但是我们想得到的往往是一个在 [0,1] ...
分类:
编程语言 时间:
2018-05-09 20:52:52
阅读次数:
389
本文利用KNIME基于Spark决策树模型算法,通过对泰坦尼克的包含乘客及船员的特征属性的训练数据集进行训练,得出决策树幸存模型,并利用测试数据集对模型进行测试。
分类:
系统相关 时间:
2018-05-09 16:05:02
阅读次数:
660