一提到机器学习,就不得不提李航的这本《统计学习方法》,回家这几日,把这本书的前九章看完了,因为后面两章HMM和CRF在之前就已经看过了,简单写一下自己的一点新认识。 这本书基本上是在围绕有监督来进行的,所谓有监督与无监督的区别:数学角度上来分析是是否知道P(Y|X),有监督是知道部分X对应的Y值,来 ...
分类:
其他好文 时间:
2018-08-18 00:44:12
阅读次数:
166
(本章主要参考李航老师的《统计学习方法》,其次是周志华老师的《机器学习》。通过自己的阅读,提炼出书中的知识点以及些许自己部分的理解(可能不到位),巩固所学知识。) 统计学习方法概论 本章简要叙述统计学习方法的一些基本概念.首先许如统计学习的定义、研究对象与方法;然后叙述监督学习;接着提出统计学习方法 ...
分类:
其他好文 时间:
2018-08-03 20:17:43
阅读次数:
184
决策树的剪枝是将生成的树进行简化,以避免过拟合。 《统计学习方法》上一个简单的方式是加入正则项a|T|,其中|T|为树的叶节点个数。 其中C(T)为生成的决策树在训练集上的经验熵,经验熵越大,表明叶节点上的数据标记越不纯,分类效果越差。有了这个标准,拿到一颗生成好的树,我们就递归的判断一组叶节点,看 ...
分类:
其他好文 时间:
2018-06-04 11:47:05
阅读次数:
145
一个简单的例子 朴素贝叶斯算法是一个典型的统计学习方法,主要理论基础就是一个贝叶斯公式,贝叶斯公式的基本定义如下: 这个公式虽然看上去简单,但它却能总结历史,预知未来。公式的右边是总结历史,公式的左边是预知未来,如果把Y看出类别,X看出特征,P(Yk|X)就是在已知特征X的情况下求Yk类别的概率,而 ...
分类:
编程语言 时间:
2018-05-23 17:02:32
阅读次数:
213
摘自《统计学习方法》 李航 第五章 决策树学习通常包括3个步骤:特征选择、决策树的生成、决策树的剪枝 决策树学习本质上是从训练集中归纳出一组分类规则。 决策树学习的损失函数通常是正则化的极大似然函数。 决策树的学习算法通常是采用启发式的方法,近似求解最优化问题 特征选择问题 特征选择在于选取对训练数 ...
分类:
其他好文 时间:
2018-05-23 00:01:55
阅读次数:
169
书籍(纸质书和pdf文档): 已经看过 数学之美 统计学习方法 python基础教程 人工智能 神经网络与深度学习 深度学习 problem solving with algorithms and data sturctures using python 还没有看完的书籍 tensorflow机器学 ...
分类:
其他好文 时间:
2018-05-18 01:24:04
阅读次数:
157
算法/数据工程师必备技能 基础知识 线性代数 矩阵理论 概率论 随机过程 图论 数值分析 最优化理论 机器学习 统计学习方法 数据挖掘 平台 Linux 语言 Python Linux shell 基础库 numpy pandas sklearn scipy matplotlib or seabor ...
分类:
编程语言 时间:
2018-05-17 23:15:26
阅读次数:
237
根据《统计学习方法》一书中的描述,条件随机场(conditional random field, CRF)是给定一组输入随机变量条件下另一组输出随机变量的条件概率分布模型,其特点是假设输出随机变量构成马尔科夫随机场。 条件随机场是一种判别式模型。 一、理解条件随机场 1.1 HMM简单介绍 HMM即 ...
分类:
其他好文 时间:
2018-05-03 19:29:38
阅读次数:
368
前几天认把感知机这一章读完了,顺带做了点笔记 现在把笔记做第三次的整理 零、总结 1. 适用于具有 线性可分的数据集的二分类问题 ,可以说是很局限了 2. 感知机本质上是一个分离超平面 3. 在向量维数(特征数)过高时,选择对偶形式算法 在向量个数(样本数)过多时,应选择原始算法 4. 批量梯度下降 ...
分类:
其他好文 时间:
2018-05-01 12:39:37
阅读次数:
172
1.回归问题:输入变量和输出变量均为连续变量的预测问题。等价于函数拟合,回归模型表示输入变量到输出变量之间映射的函数。 2. 分类问题:输出变量为有限个离散变量的预测问题称为分类问题 3.标注问题:输入变量和输出变量均为变量序列的预测问题 4.假设空间:模型属于有输入空间到输出空间的映射的集合,这个 ...
分类:
其他好文 时间:
2018-04-18 21:17:20
阅读次数:
138