机器学习目标:(二分类) 经验风险: 过度拟合: 经验风险最小化: 结构风险最小化: 正则: 特点: 误差错误估计错误: 误差上界分析: R(g)的经验风险上界: 对错误分类的误差F定义(值域[0或1]): F和R的关系: 关于F的Hoe不等式: 意义: 统一上界: 与Hoe的差异: 增长函数: V ...
分类:
其他好文 时间:
2017-06-28 21:49:50
阅读次数:
594
我们在设计机器学习系统时,特别希望能够建立类似人脑的一种机制。神经网络就是其中一种。但是考虑到实际情况,一般的神经网络(BP网络)不需要设计的那么复杂,不需要包含反馈和递归。人工智能的一大重要应用,是分类问题。本文通过分类的例子,来介绍神经网络。 1.最简单的线性分类 一个最简单的分类,是在平面上画 ...
分类:
编程语言 时间:
2017-04-18 00:52:49
阅读次数:
250
因为SVM和统计机器学习内容很多,所以从 http://www.cnblogs.com/charlesblc/p/6188562.html 这篇文章里面分出来,单独写。 为什么说SVM和统计学关系很大。 看统计学的定义:统计学是通过搜索、整理、分析、描述数据等手段,以达到推断所测对象的本质,甚至预测 ...
分类:
编程语言 时间:
2016-12-18 12:35:39
阅读次数:
224
一、定义: 有n个训练样本Zn={zi(xi,yi), i=1,2,...,n},定义N(Zn)为函数集中的函数能对样本分类的数目。 解释:xi 代表特征向量如d维特征向量,yi代表一个标记如0或1, 因此zi就是对一个特征的标记,Zn中有n个样本,可能的标记方式2n种,一种标记方式就生成一种样本集 ...
分类:
其他好文 时间:
2016-11-29 21:52:20
阅读次数:
895
1.统计学习
统计学习是关于计算机基于数据构建概率统计模型并运用模型对数据进行预测与分析的一门学科,也称统计机器学习。统计学习是数据驱动的学科。统计学习是一门概率论、统计学、信息论、...
分类:
其他好文 时间:
2016-10-31 22:20:38
阅读次数:
380
协方差:两个变量总体误差的期望。简单的说就是度量Y和X之间关系的方向和强度。X:预测变量Y:响应变量Y和X的协方差:[来度量各个维度偏离其均值的程度]备注:[之所以除以n-1而不是除以n,是因为这样能使我们以较小的样本集更好的逼近总体的协方差,即统计上所谓的“无偏估计..
分类:
其他好文 时间:
2016-10-11 22:25:43
阅读次数:
527
引自:http://blog.csdn.net/zbc1090549839/article/details/45047377 有幸用最近两个月的业余时间把”统计机器学习”一书粗略的学习了一遍,同时结合“模式识别”、“数据挖掘概念与技术”的知识点,对机器学习的一些知识结构进行梳理与总结: 机器学习包括 ...
分类:
其他好文 时间:
2016-09-13 20:29:06
阅读次数:
194
当我们尝试使用统计机器学习方法解决文本的有关问题时,第一个需要的解决的问题是,如果在计算机中表示出一个文本样本。一种经典而且被广泛运用的文本表示方法,即向量空间模型(VSM),俗称“词袋模型”。 我们首先看一下向量空间模型如何表示一个文本: 空间向量模型需要一个“字典”:文本的样本集中特征词集合,这 ...
分类:
其他好文 时间:
2016-06-10 13:36:34
阅读次数:
456
机器学习在商业系统应该是用的最多了,和传统人工区分开,因为数据集量级太大和复杂度太高,机器可以发现人难以发现的模型,基于模型的方式处理可以避免人的情感偏见。人工也是不可以完全抛开的,比如监督式的学习,靠人工;来标记数据,训练模型。文本标记和文本的情感标识别,还有就是破解验证码时基于CNN大量的训练集要靠人来处理,也是醉了,那是很累啊。模型出来后,可以做成服务整合到其他系统中,
机器学习应用在:
个...
分类:
其他好文 时间:
2016-05-12 14:39:18
阅读次数:
199
1.1 统计学习概念
统计学习(statistical learning)是关于计算机基于数据构建概率统计模型并运用模型对数据进行预测和分析的一门学科,统计学习也成为统计机器学习(statistical machine learning).
特点
统计学习将数据作为研究对象,是数据驱动的学科
统计学习的目的是对数据进行预测和分析
统计学习以方法为中心,统计学习方法构建模型并应用...
分类:
其他好文 时间:
2016-05-07 07:46:37
阅读次数:
154