第一章 统计学习方法概论 学习:如果一个系统能够通过执行某个过程改进它的性能,这就是学习 监督学习:从训练数据集中学习模型,对测试数据进行预测 回归问题:输入变量与输出变量均为连续变量的预测问题 分类问题:输出变量为有限个离散变量的预测问题 标注问题:输入变量与输出变量均为变量序列的预测问题 损失函 ...
分类:
其他好文 时间:
2017-07-20 17:24:19
阅读次数:
225
对学习的定义 学习经验E 完成任务T 绩效指标P 对于某类任务T和性能度量P,如果一个计算机程序在完成T上以P来衡量完成的好坏,并随着经验E而自我完善,那么我们称这个计算机程序在从经验E中学习 (常用)机器学习算法,主要是以下两种: 监督学习 非监督学习 (其他)学习算法等 加强学习 推荐系统 (概 ...
分类:
其他好文 时间:
2017-07-15 12:37:01
阅读次数:
145
学完机器学习cs229前10集,满心的疑惑,感觉找到了新世界,但是还没找到钥匙, 故总结一波,结合cs229讲义,课后作业,中文笔记,Coursera版机器学习的笔记,Coursera版编程作业,机器学习-周志华,统计学习方法-李航,相关章节,试图完善整个监督学习体系,尝试理解SVM(不做高要求,看 ...
分类:
其他好文 时间:
2017-07-14 21:19:56
阅读次数:
186
传统机器学习依赖良好的特征工程。深度学习解决有效特征难人工提取问题。无监督学习,不需要标注数据,学习数据内容组织形式,提取频繁出现特征,逐层抽象,从简单到复杂,从微观到宏观。 稀疏编码(Sparse Coding),基本结构组合。自编码器(AutoEncoder),用自身高阶特征编码自己。期望输入/ ...
分类:
其他好文 时间:
2017-07-10 00:33:22
阅读次数:
283
这篇博客是关于机器学习中监督学习的k近邻算法,将介绍2个实例,分别是使用k-近邻算法改进约会网站的效果和手写识别系统. ...
分类:
编程语言 时间:
2017-07-09 13:52:26
阅读次数:
234
监督学习:分类和回归 非监督学习:聚类和非聚类 1.分类和聚类的区别: 分类(Categorization or Classification)就是按照某种标准给对象贴标签(label),再根据标签来区分归类。 聚类是指事先没有“标签”而通过某种成团分析找出事物之间存在聚集性原因的过程。 2.回归和 ...
分类:
系统相关 时间:
2017-07-04 20:27:19
阅读次数:
252
转自:http://www.cnblogs.com/jerrylead 1 摘要 本报告是在学习斯坦福大学机器学习课程前四节加上配套的讲义后的总结与认识。前四节主要讲述了回归问题,回归属于有监督学习中的一种方法。该方法的核心思想是从连续型统计数据中得到数学模型,然后将该数学模型用于预测或者分类。该方 ...
分类:
其他好文 时间:
2017-07-03 21:01:32
阅读次数:
282
统计学习方法概论: (一),统计学习 1,统计学习的特点 2,统计学习的对象 3,统计学习的目的 4,统计学习的方法 (二),监督学习重要概念 1,输入空间,特征向量空间,输出空间 (三),统计学习三要素 1,模型 决策函数模型: 条件概率模型: 2,策略 2.1 损失函数: 2.2 经验风险最小化 ...
分类:
其他好文 时间:
2017-06-30 23:53:33
阅读次数:
216
KPCA,中文名称”核主成分分析“,是对PCA算法的非线性扩展,言外之意,PCA是线性的,其对于非线性数据往往显得无能为力,例如,不同人之间的人脸图像,肯定存在非线性关系,自己做的基于ORL数据集的实验,PCA能够达到的识别率只有88%,而同样是无监督学习的KPCA算法,能够轻松的达到93%左右的识 ...
分类:
其他好文 时间:
2017-06-28 20:27:29
阅读次数:
267
2017-06-25 20:53:07 一、机器学习的定义 Tom Mitchell:机器学习是对能通过经验自动改进的计算机算法的研究。机器学习可以彰显数据背后真正的含义。 二、机器学习的分类 (1)监督学习 supervised learning 所谓监督学习,就是指在学习过程中会有一组标准答案提 ...
分类:
其他好文 时间:
2017-06-25 23:12:01
阅读次数:
252