下载地址:网盘下载 内容简介 · · · · · · 本书介绍了统计学习理论和支持向量机的关键思想、结论和方法,以及该领域的最新进展。统计学习理论是针对小样本情况研究统计学习规律的理论,是传统统计学的重要发展和补充。其核心思想是通过控制学习机器的容量实现对推广能力的控制。由Springer-Verl ...
分类:
其他好文 时间:
2018-07-07 10:36:20
阅读次数:
616
前提: 统计学习(统计分析)和机器学习之间的区别 金融公司采用机器学习技术及招募相关人才 了解不同类型的机器学习 有监督学习 vs 无监督学习 迭代和评估 偏差方差权衡 结合有监督学习和无监督学习(半监督学习) 了解机器学习语言和工具集 开源 vs 专有系统和软件 Python vs R vs Ma ...
分类:
其他好文 时间:
2018-07-03 15:18:30
阅读次数:
197
决策树的剪枝是将生成的树进行简化,以避免过拟合。 《统计学习方法》上一个简单的方式是加入正则项a|T|,其中|T|为树的叶节点个数。 其中C(T)为生成的决策树在训练集上的经验熵,经验熵越大,表明叶节点上的数据标记越不纯,分类效果越差。有了这个标准,拿到一颗生成好的树,我们就递归的判断一组叶节点,看 ...
分类:
其他好文 时间:
2018-06-04 11:47:05
阅读次数:
145
定义:从广义上来说,机器学习是一种能够赋予机器学习的能力以此让它完成直接编程无法完成的功能的方法。但从实践的意义上来说,机器学习是一种通过利用数据,训练出模型,然后使用模型预测的一种方法。 机器学习所牵扯的一些相关范围的学科与研究领域:模式识别,数据挖掘,统计学习,计算机视觉,语音识别, 自然语言处 ...
分类:
其他好文 时间:
2018-05-29 17:43:03
阅读次数:
153
一个简单的例子 朴素贝叶斯算法是一个典型的统计学习方法,主要理论基础就是一个贝叶斯公式,贝叶斯公式的基本定义如下: 这个公式虽然看上去简单,但它却能总结历史,预知未来。公式的右边是总结历史,公式的左边是预知未来,如果把Y看出类别,X看出特征,P(Yk|X)就是在已知特征X的情况下求Yk类别的概率,而 ...
分类:
编程语言 时间:
2018-05-23 17:02:32
阅读次数:
213
摘自《统计学习方法》 李航 第五章 决策树学习通常包括3个步骤:特征选择、决策树的生成、决策树的剪枝 决策树学习本质上是从训练集中归纳出一组分类规则。 决策树学习的损失函数通常是正则化的极大似然函数。 决策树的学习算法通常是采用启发式的方法,近似求解最优化问题 特征选择问题 特征选择在于选取对训练数 ...
分类:
其他好文 时间:
2018-05-23 00:01:55
阅读次数:
169
书籍(纸质书和pdf文档): 已经看过 数学之美 统计学习方法 python基础教程 人工智能 神经网络与深度学习 深度学习 problem solving with algorithms and data sturctures using python 还没有看完的书籍 tensorflow机器学 ...
分类:
其他好文 时间:
2018-05-18 01:24:04
阅读次数:
157
算法/数据工程师必备技能 基础知识 线性代数 矩阵理论 概率论 随机过程 图论 数值分析 最优化理论 机器学习 统计学习方法 数据挖掘 平台 Linux 语言 Python Linux shell 基础库 numpy pandas sklearn scipy matplotlib or seabor ...
分类:
编程语言 时间:
2018-05-17 23:15:26
阅读次数:
237
一、训练误差与测试误差 统计学习的目的就是利用已经学到的模型对已知数据和未知数据进行预测,因此在损失函数确定的情况下,基于损失函数的训练误差和测试误差就成了我们对模型进行评价的一个标准。 注意:在统计学习中使用的损失函数未必和评估中使用的损失函数一样。 训练误差的大小对于判断给定问题是否容易学习是有 ...
分类:
其他好文 时间:
2018-05-14 10:25:56
阅读次数:
142
首先推荐一篇文章:神经网络浅讲:从神经元到深度学习,介绍的一些神经网络的发展过程等等,能够在一定程度上面帮助我们理解神经网络。 M-P神经元 计算机当中的神经网络是模仿生物神经网络。单个的神经元是由树突,轴突,还有细胞核组成,刺激由树突传递到细胞核,当这些阈值超过一定的值以后,这个神经元激活,然后再 ...
分类:
其他好文 时间:
2018-05-09 19:39:58
阅读次数:
342