监督学习(Supervised Learning) 添加标签,手把手训练。 比如线性回归算法。 半监督学习(Semi-supervised Learning) 非监督学习(Unsupervised Learning) 通过有标签或没标签的数据集,让机器自己去找出规律。比如分类算法。 结构化学习(St ...
分类:
其他好文 时间:
2020-06-26 18:40:25
阅读次数:
55
1.1. 数据科学基础 1.1.1. 概率基础 1. 概率的定义概率的完备定义;古典概率;基于频率的概率估计;基于专家推测的概率估计 随机变量及其特征度量随机变量定义;随机变量数学期望;随机变量方差与标准差;期望-方差决策理论;相关性;独立性; 常用离散随机变量分布贝努利分布;二项分布;泊松分布 常 ...
分类:
其他好文 时间:
2020-06-23 00:44:39
阅读次数:
136
算法原理 朴素贝叶斯是经典的机器学习算法之一,也是为数不多的基于概率论的分类算法。朴素贝叶斯原理简单,也很容易实现,多用于文本分类,比如垃圾邮件过滤。 该算法的优点在于简单易懂、学习效率高、在某些领域的分类问题中能够与决策树、神经网络相媲美。 但由于该算法以自变量之间的独立(条件特征独立)性和连续变 ...
分类:
编程语言 时间:
2020-06-17 20:14:27
阅读次数:
73
主要思想 根据现有数据对分类边界线建立回归公式,以此进行分类,其核心是通过最优化算法寻找最佳回归系数(权重系数),主要应用于二分类。 算法原理 二分类的特点是非此即彼,其数学特性符合单位阶跃函数,在某一点会发生突变。这也符合我们现实当中的一些应用场景(比如分数从0 到 60会很容易,越往上你所花的时 ...
分类:
编程语言 时间:
2020-06-17 19:55:29
阅读次数:
55
1.KNN 分类算法 由于knn算法涉及到距离的概念,KNN 算法需要先进行归一化处理 1.1 归一化处理 scaler from sklearn.preprocessing import StandardScaler standardScaler =StandardScaler() standar ...
分类:
编程语言 时间:
2020-06-17 18:37:11
阅读次数:
74
什么是监督学习?什么是无监督学习? 监督学习:有目标y值,如线性回归,分类算法 无监督学习:无目标y值,如聚类 逻辑回归是分类算法,不要被名字误导,得到的是离散值 引入逻辑回归 逻辑回归主要用于二分类 在线性回归中:Y=W1X1+W2X2+W3X3 +...+b=WT*X 在逻辑回归中,习惯用Z表示 ...
分类:
其他好文 时间:
2020-06-17 01:18:52
阅读次数:
55
目录 fastText概述 基础知识 LDA主题模型 总结 一句话简述:fastText提出了子词嵌入(subword embedding)的方法。是一种监督学习方法。和word2vec 中的CBOW结构很相似。运行速度较快。 一、fastText概述 1.1 背景 在word2vec中,我们并没有... ...
分类:
编程语言 时间:
2020-06-16 20:14:28
阅读次数:
76
一 对数回归 全称为对数几率回归,其它文献也称为 线性回归。 虽然称为回归,但实际是分类算法。 本质是广义线性模型。通过sigmoid函数(联系函数),将回归模型的预测值与分类的真实标记联系起来。 只适用于二分类? 多分类情况 采用 OvO或者OvR策略解决。 类别不平衡问题 采用 再缩放 (res ...
分类:
其他好文 时间:
2020-06-13 17:10:07
阅读次数:
99
老师:MissDu 1.理解分类与监督学习、聚类与无监督学习。 简述分类与聚类的联系与区别。 简述什么是监督学习与无监督学习。 答: 1. 分类与聚类: 联系:分类和聚类都包含一个过程:对于想要分析的目标点,都会在数据集中寻找离它最近的点,即二者都用到了NN算法。 区别:分类的目的是为了确定一个点的 ...
分类:
编程语言 时间:
2020-06-10 23:01:39
阅读次数:
98
1.理解分类与监督学习、聚类与无监督学习。 简述分类与聚类的联系与区别。 简述什么是监督学习与无监督学习。 2.朴素贝叶斯分类算法 实例 利用关于心脏病患者的临床历史数据集,建立朴素贝叶斯心脏病分类模型。 有六个分类变量(分类因子):性别,年龄、KILLP评分、饮酒、吸烟、住院天数 目标分类变量疾病 ...
分类:
其他好文 时间:
2020-06-09 09:25:21
阅读次数:
87