Reference:李航 --《统计学习方法》 10 种主要的统计学习方法概括总结 方法 适用问题 模型特点 模型类型 学习策略 学习的损失函数 学习算法 感知机 二类分类 分离超平面 判别模型 极小化误分点到超平面距离 误分点到超平面距离 随机梯度下降 k 近邻 多类分类,回归 特征空间,样本点 ...
分类:
其他好文 时间:
2020-07-06 14:36:46
阅读次数:
104
统计学习三要素(模型,策略,算法): 模型:假设空间,假设输入到输出之间的关系,获得一个参数向量 策略:按照什么准则(损失函数,风险函数,经验风险函数=>结构风险函数)选择最好的模型 算法:学习模型的具体计算方法 统计学习三要素 统计学习三要素个人理解 卷积神经网络CNN 卷积神经网络--输入层、卷 ...
分类:
其他好文 时间:
2020-07-05 23:25:17
阅读次数:
111
1. 支持向量机(Support Vector Machine, SVM): 一种知名的二元线性/非线性分类方法,由俄罗斯的统计学家Vapnik等人所提出。它使用一个非线性转换(Nonlinear Transformation)将原始数据映像(Mapping)至较高维度的特征空间 (Feature ...
分类:
其他好文 时间:
2020-07-05 15:28:57
阅读次数:
70
C5.0是对ID3算法的改进。 1.引入了分支度Information Value的概念。 C5.0是用哪个信息增益率作为判断优先划分属性的。 信息增益率其实就是在信息增益 除了 分支度。分支度的计算公式如上,就是指,若某划分属性S将样本T划分成n个子集T1,T2,...Tn,则此属性S的分支度就等 ...
分类:
编程语言 时间:
2020-07-04 16:45:02
阅读次数:
118
原文:http://blog.chinaunix.net/uid-10289334-id-3758310.html 基于划分聚类算法(partition clustering) k-means: 是一种典型的划分聚类算法,它用一个聚类的中心来代表一个簇,即在迭代过程中选择的聚点不一定是聚类中的一个点 ...
分类:
编程语言 时间:
2020-07-01 16:16:44
阅读次数:
76
1. 数据挖掘需要哪些基本的技术 统计学知识和技术(Statistical Techniques) 可视化的画图展示技术(Visualization Tchniques):比如可以利用相关软件来画出柱状图、散点图等等 一些常用的数据挖掘技术. KNN K紧邻算法 常用数据挖掘建模技术 2.常用数据挖 ...
分类:
其他好文 时间:
2020-06-27 17:30:38
阅读次数:
77
推断统计 是研究如何利用样本数据来推断总体特征的统计方法 从样本信息外推到总体,以最终获得对总体问题的解答 今日内容 统计学的几个概念 概率分布 抽样分布 参数估计 假设检验 统计学的几个概念 变量 1 分类变量 无序分类变量 说明事物类别的一个名称,如性别有男女两种,二者无大小之分,无顺序之分,还 ...
分类:
其他好文 时间:
2020-06-26 14:33:05
阅读次数:
99
机器学习(Machine Learning, ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。
下面分**机器学习**和**深度学习**分开理清楚... ...
分类:
其他好文 时间:
2020-06-24 21:32:08
阅读次数:
136
1.什么是统计学,什么是描述统计,什么是推断统计 统计学(statistics):收集、处理、分析、解释数据并从数据中得出结论的科学。 描述统计(discriptive statistics) 描述统计(discriptive statistics):研究的是数据收集、处理、汇总、图表描述、概括与分 ...
分类:
其他好文 时间:
2020-06-23 21:08:20
阅读次数:
103
作者|Jacob Gursky 编译|VK 来源|Towards Data Science 介绍 如果我告诉你训练神经网络不需要计算梯度,只需要前项传播你会怎么样?这就是神经进化的魔力!同时,我要展示的是,所有这一切只用Numpy都可以很容易地做到!学习统计学你会学到很多关于基于梯度的方法,但是不久 ...
分类:
其他好文 时间:
2020-06-21 16:19:59
阅读次数:
61