朴素:在给定类别的情况下,各个特征相互独立 贝叶斯公式:P(A|B)=P(A)P(B|A)/P(B) 朴素贝叶斯:P(特征|类别)=P(特征)P(类别|特征)/P(类别) 核心思想:算一下概率,那种类别概率大,就分为那种类别。 在scikit-learn中的实现: 1.高斯贝叶斯:数据集符合高斯(正 ...
分类:
其他好文 时间:
2020-06-25 12:11:08
阅读次数:
100
快速幂顾名思义,就是快速算某个数的多少次幂。 其时间复杂度为O(log?N),与朴素的O(N)相比效率有了极大的提高。 核心思想就是 如果$k$是偶数 那么 \(x^ k =(x^{2})^{\tfrac{k}{2}}\) 如果$k$是奇数 那么 \(x ^ k = x * x ^{ ( k - 1 ...
分类:
其他好文 时间:
2020-06-24 23:24:39
阅读次数:
47
题目链接:http://poj.org/problem?id=2286 对于24个数组成的#,一共有8中拉的方式,求使得中间8个数相同的最小操作以及操作方式,由于一个结点扩展的分支有7个,所以朴素dfs将会在无法获得最优解的分支上花费太多时间 通过枚举操作次数可以避免dfs搜索过深,并且加上未来估计 ...
分类:
编程语言 时间:
2020-06-22 11:12:25
阅读次数:
63
$\text$序列,是树与序列的一种双射。 ##构建过程: 每次找到一个编号最小的叶子节点$Leaf$,将它删掉,并将它所连接的点的度数$-1$,且加入$\text$序列。 重复上述步骤,直到只剩下两个点。 ##实现: 考虑如何实现。 最朴素的显然每次暴力找,复杂度$O(n^2).$显然不够优秀。 ...
分类:
其他好文 时间:
2020-06-21 18:13:00
阅读次数:
67
SmartbiMining通过深度数据建模,为企业提供预测能力支持文本分析、五大类算法和数据预处理,并为用户提供一站式的流程式建模、拖拽式操作和可视化配置体验。SmartbiMining算法丰富,而且可扩展SmartbiMining数据挖掘平台支持多种高效实用的机器学习算法,包含了分类、回归、聚类、预测、关联,5大类机器学习的成熟算法。其中包含了多种可训练的模型:逻辑回归、决策树、随机森林、朴素贝
分类:
其他好文 时间:
2020-06-19 16:04:38
阅读次数:
182
在NLP中,对于把词转为向量的操作,最朴素的想法是one-hot独热编码形式,即一个词占一维向量。但这样有两个缺点: 1)不考虑词与词之间的顺序(文本中词的顺序也很重要) 2)假设词是独立的。例如猫和狗、床和沙发,词之间原本是有不同的亲疏远近关系的 3)得到的特征是稀疏的。如果所有的词各占一维,那么 ...
分类:
其他好文 时间:
2020-06-18 19:26:08
阅读次数:
59
算法原理 朴素贝叶斯是经典的机器学习算法之一,也是为数不多的基于概率论的分类算法。朴素贝叶斯原理简单,也很容易实现,多用于文本分类,比如垃圾邮件过滤。 该算法的优点在于简单易懂、学习效率高、在某些领域的分类问题中能够与决策树、神经网络相媲美。 但由于该算法以自变量之间的独立(条件特征独立)性和连续变 ...
分类:
编程语言 时间:
2020-06-17 20:14:27
阅读次数:
73
1. 读邮件数据集文件,提取邮件本身与标签。 列表 numpy数组 2.邮件预处理 邮件分句 名子分词 去掉过短的单词 词性还原 连接成字符串 传统方法来实现 nltk库的安装与使用 pip install nltk import nltk nltk.download() # sever地址改成 h ...
分类:
其他好文 时间:
2020-06-16 13:15:18
阅读次数:
60
1. 读邮件数据集文件,提取邮件本身与标签。 列表 numpy数组 2.邮件预处理 邮件分句 句子分词 大小写,标点符号,去掉过短的单词 词性还原:复数、时态、比较级 连接成字符串 2.1 传统方法来实现 2.2 nltk库的安装与使用 pip install nltk import nltk nl ...
分类:
其他好文 时间:
2020-06-14 20:23:08
阅读次数:
60
大学里的三点收获 2001年我考入了南开大学,起初大学的生活是让人有点失落的,但慢慢地从安静朴素的校园和踏实努力的氛围中,我还是找到了自己的节奏。大学期间我主要在做三件事情 ,一是写代码,因为我是搞技术的;二是看书,看了很多很多书;三是修电脑。基于此自己也有三点收获:耐心,知识,伙伴。 第一点收获: ...
分类:
其他好文 时间:
2020-06-13 19:47:14
阅读次数:
377