机器学习概论 目录 模式识别 计算机视觉 数据挖掘 语言识别 统计学习 自然语言处理 学习过程 工具库 Numpy: 科学计算库 Pandas: 数据分析处理库 Matplotlib: 数据可视化库 Scikit learn: 机器学习库 分类 有监督类算法 无监督类算法 有监督是进行标记 回归算法 ...
分类:
其他好文 时间:
2019-08-10 09:19:59
阅读次数:
97
机器学习是一门交叉学科 机器学习和很多名词相关 ,包括: 模式识别, 数据清洗,数据挖掘,统计学习,计算机视觉,语音识别 , 深度学习 模式识别,机器学习也是模式学习,只是换了个说法,机器学习把各种各样的场景当成各种模式,把模式识别出来,相当于总结模式的规律 数据挖掘, 很多时候是和数据库的知识,然 ...
分类:
其他好文 时间:
2019-08-04 01:24:12
阅读次数:
93
? 使用 Ada Boosting 方法提升若干个弱分类器的效果 ● 代码,每个感知机仅训练原数据集 trainRatio = 30% 的数据,然后进行调整和提升 ● 输出结果,随着使用的弱分类器数量的增多,预测精度逐渐上升。低维情况不明显,少数的弱分类器就已经达到了较好的精度,高维情况中,精度上升 ...
分类:
其他好文 时间:
2019-08-02 00:00:25
阅读次数:
102
1 朴素贝叶斯自编程实现 2 朴素贝叶斯的sklearn实现 参考: [1] 深度之眼统计学习方法集训营课后练习 [2] 《统计学习方法》李航 ...
分类:
其他好文 时间:
2019-07-31 13:18:49
阅读次数:
93
? 使用逻辑地模型来进行分类,可以算出每个测试样本分属于每个类别的概率 ● 二分类代码 ● 输出结果 ● 画图 ● 多分类代码(坑) ...
分类:
其他好文 时间:
2019-07-26 17:41:15
阅读次数:
105
1. 算法思想 对线性可分的情形:通过最大化硬间隔(几何间隔),找出最佳分离超平面,从而分类数据 对弱线性可分情形:最大化软间隔(通过加一个松弛因子),找出分离超平面,分类数据 线性不可分的情形:通过核技巧把原始数据映射到高维空间,转化为线性可分的情形,然后继续求解。 2. 算法推导 (1)函数间隔 ...
分类:
其他好文 时间:
2019-07-18 22:31:24
阅读次数:
149
第三章 经典算法 0 写在前面 本章介绍了 SVM,逻辑回归和决策树 三个经典算法。这三个算法在李航的《统计学习方法》中分别拿出了三章重点讲解。本节的提问需要有相应的基础,通过书中的提问发现自己基础太弱了,而基础知识最能考察一个人的学习能力。(记得考研时张宇说过,基础知识不等于简单知识,越是抽象的基 ...
分类:
编程语言 时间:
2019-07-18 00:21:27
阅读次数:
199
最小二乘法则是一种统计学习优化技术,它的目标是最小化误差平方之和来作为目标J(θ)J(θ),从而找到最优模型。 7. SciPy最小二乘法 最小二乘法则是一种统计学习优化技术,它的目标是最小化误差平方之和来作为目标J(θ),从而找到最优模型。 1、线性最小二乘法 假设真实的模型是y=2x+1,我们有 ...
分类:
其他好文 时间:
2019-07-15 17:29:33
阅读次数:
387
? k 近邻法来分类,用到了 kd 树的建立和搜索 ● 代码 ● 输出结果 ● 画图 ...
分类:
其他好文 时间:
2019-07-09 20:57:14
阅读次数:
137
问题来源 在读论文的时候,遇到了ADMM(交替方向乘子法)算法,不明所以,于是查了一下,大概是一个凸优化算法,下面大概讲一下其原理和过程。 简介 交替方向乘子法(ADMM)是一种求解具有可分离的凸优化问题的重要方法,由于处理速度快,收敛性能好,ADMM算法在统计学习、机器学习等领域有着广泛应用。 文 ...
分类:
其他好文 时间:
2019-06-17 20:26:13
阅读次数:
165