# 读取数数据, 查看数据结构 df_raw <- read.csv("sms_spam.csv", stringsAsFactors=F) str(df_raw) length(df_raw$type) # 将数据分为特征值矩阵 X 和 类标向量y 两部分,将 y 换为因子 X <- df_raw ...
分类:
移动开发 时间:
2019-11-26 19:15:47
阅读次数:
120
基于贝叶斯定理与特征条件独立假设的分类方法。对于给定的训练集,首先基于特征条件独立假设学习输入/输出的联合概率分布;然后基于此模型,对于给定的输入,利用贝叶斯定理求出后验概率最大的输出$y$。 朴素贝叶斯法通过训练数据集学习联合概率分布$P(X,Y)$。具体地,学习以下先验概率分布及条件概率分布。先 ...
分类:
其他好文 时间:
2019-11-24 15:20:43
阅读次数:
67
数据来源 通过爬虫,爬取腾讯新闻三个分类每个分类大约1000条左右数据,存入excel 以上是大体的数据,三列分别为title、content、class;由于这里讲的的不是爬虫,爬虫部分省略 项目最终结构 其中主要逻辑在native_bayes.py文件中实现,utils.py为部分工具函数,tr ...
分类:
其他好文 时间:
2019-11-12 20:14:04
阅读次数:
192
带你搞懂朴素贝叶斯分类算法 带你搞懂朴素贝叶斯分类算 贝叶斯分类是一类分类算法的总称,这类算法均以贝叶斯定理为基础,故统称为贝叶斯分类。而朴素朴素贝叶斯分类是贝叶斯分类中最简单,也是常见的一种分类方法。这篇文章我尽可能用直白的话语总结一下我们学习会上讲到的朴素贝叶斯分类算法,希望有利于他人理解。 1 ...
分类:
编程语言 时间:
2019-11-11 00:28:24
阅读次数:
94
朴素贝叶斯分类器 (naive bayes classifier, NBC) 是一种常见且简单有效的贝叶斯分类算法。对已知类别,朴素贝叶斯分类器在估计类条件概率时假设特征之间条件独立。这样的假设,可以使得在有限的训练样本下,原本难以计算的联合概率 $P(X_1, X_2, \cdots, X_n | ...
分类:
其他好文 时间:
2019-11-07 19:14:57
阅读次数:
106
python分类预测模型的特点 模型 模型特点 位于 SVM 强大的模型,可以用来回归,预测,分类等,而根据选取不同的和函数,模型可以是线性的/非线性的 sklearn.svm 决策树 基于"分类讨论,逐步细化"思想的分类模型,模型直观,易解释 sklearn.tree 朴素贝叶斯 基于概率思想的简 ...
分类:
编程语言 时间:
2019-11-03 14:59:46
阅读次数:
141
学习器模型中一般有两个参数:一类参数可以从数据中学习估计得到,还有一类参数无法从数据中估计,只能靠人的经验进行指定,后一类参数就叫超参数 比如,支持向量机里的C,Kernel,gama,朴素贝叶斯里的alpha等,在学习其模型的设计中,我们要搜索超参数空间为学习器模型找到最合理的超参数,可以通过以下 ...
分类:
其他好文 时间:
2019-10-31 17:57:17
阅读次数:
78
sklearn监督学习的各个模块 neighbors近邻算法,svm支持向量机,kernal_ridge核岭回归,discriminant_analysis判别分析,linear_model广义线性模型 ensemble集成方法,tree决策树,native_bayes朴素贝叶斯,cross_dec ...
分类:
编程语言 时间:
2019-10-31 17:52:59
阅读次数:
98
是基本算法,和决策树一样,是树模型中的基础算法,朴素贝叶斯是贝叶斯中的一个算法,是基于统计学的,在文本处理领域应用广泛。 需要先掌握贝叶斯定理: 联合概率(两个事件同时发生的概率) 条件概率(事件A发生的情况下,B的概率)= AB的联合概率/A发生的概率 乘法公式:条件概率变形 联合概率—天剑概率— ...
分类:
其他好文 时间:
2019-10-30 18:15:05
阅读次数:
69
标签: 机器学习 1. 贝叶斯公式是机器学习中常用的计算方法,例如,甲射中靶标的概率是0.4,乙射中靶标的概率是0.8,现在有个人中靶了,问问是甲射中的概率。这非常好计算,P=0.4/(0.8+0.4)=0.33,这是贝叶斯公式的基本应用,具体的贝叶斯公式如下: 2. 《机器学习实战》中的贝叶斯实现 ...
分类:
其他好文 时间:
2019-10-27 15:05:13
阅读次数:
116