本章内容□使用概率分布进行分类□学习朴素贝叶斯分类器□解析RSS源数据口使用朴素贝叶斯来分析不同地区的态度 前两章我们要求分类器做出艰难决策,给出“该数据实例属于哪一类”这类问题的明确答案。不过,分类器有时会产生错误结果,这时可以要求分类器给出一个最优的类别猜测结果,同时给出这个猜测的概率估计值。 ...
分类:
其他好文 时间:
2016-05-01 16:21:50
阅读次数:
237
作为集成学习的二个方法,其实bagging和boosting的实现比较容易理解,但是理论证明比较费力。下面首先介绍这两种方法。
所谓的集成学习,就是用多重或多个弱分类器结合为一个强分类器,从而达到提升分类方法效果。严格来说,集成学习并不算是一种分类器,而是一种分类器结合的方法。
1.bagging
bagging算是很基础的集成学习的方法,他的提出是为了增强分类器效果,但是在处理不平衡问题上...
分类:
其他好文 时间:
2016-04-26 22:09:00
阅读次数:
161
Linux信号(signal) 机制分析 【摘要】本文分析了Linux内核对于信号的实现机制和应用层的相关处理。首先介绍了软中断信号的本质及信号的两种不同分类方法尤其是不可靠信号的原理。接着分析了内核对于信号的处理流程包括信号的触发/注册/执行及注销等。最后介绍了应用层的相关处理,主要包括信号处理函 ...
分类:
系统相关 时间:
2016-04-22 16:07:50
阅读次数:
283
分三个部分进行讲述: 1 五类IP 2 特殊用途的IP 3 私有IP 1 五类IP IPV4简单粗暴地把IP地址分为五类。分类方法如下图所示: 也就是说,分为以下几类: A: 0.0.0.0-127.255.255,其中段0和127不可用 B: 128.0.0.0-191.255.255.255 C ...
分类:
其他好文 时间:
2016-04-03 11:42:25
阅读次数:
132
文本数据的机器学习自动分类方法(上): http://www.infoq.com/cn/articles/machine-learning-automatic-classification-of-text-data?utm_source=tuicool&utm_medium=referral 文本数 ...
分类:
其他好文 时间:
2016-04-02 20:13:06
阅读次数:
380
朴素贝叶斯(naive bayes)标签: Python 机器学习主要参考资料:《机器学习实战》《统计学习方法》1.朴素贝叶斯分类原理朴素贝叶斯法是基于贝叶斯定理和特征条件独立假设(称为朴素的原因)的分类方法。先看看维基百科中贝叶斯定理的描述:
贝叶斯定理(维基百科)
通常,事件A在事件B(发生)的条件下的概率,与事件B在事件A的条件下的概率是不一样的;然而,这两者是有确定的关系,贝叶斯定...
分类:
其他好文 时间:
2016-04-01 18:14:48
阅读次数:
204
第12章 统计学习方法总结
1 适用问题
分类问题是从实例的特征向量到类标记的预测问题;标注问题是从观测序列到标记序列(或状态序列)的预测问题。可以认为分类问题是标注问题的特殊情况。
分类问题中可能的预测结果是二类或多类;而标注问题中可能的预测结果是所有的标记序列,其数目是指数级的。
感知机、k近邻法、朴素贝叶斯法、决策树是简单的分类方法,具有模型直观、方法简单、实现容易等特...
分类:
其他好文 时间:
2016-03-30 13:14:29
阅读次数:
232
第6章 逻辑回归与最大熵模型
逻辑回归(logistic regression)是统计学习中的经典分类方法。最大嫡是概率模型学习的一个准则将其推广到分类问题得到最大熵模型(maximum entropy model)。逻辑回归模型与最大熵模型都属于对数线性模型。
6.1 逻辑回归模型
定义6.1(逻辑分布):设X是连续随机变量,X服从逻辑斯谛分布是指
X具有下列分布函数和密度函...
分类:
其他好文 时间:
2016-03-30 13:13:41
阅读次数:
225
第4章 朴素贝叶斯法
朴素贝叶斯 (naive Bayes) 法是基于贝叶斯定理与特征条件独立假设的分类方法。对于给定的训练数据集,首先基于特征条件独立假设学习输入/输出的联合概率分布;然后基于此模型,对给定的输入x,利用贝叶斯定理求出后验概率最大的输出Y。
4.1 朴素贝叶斯法的学习与分类
基本方法
朴素贝叶斯法通过训练数据集学习X和Y的联合概率分布
P(X,Y)。
...
分类:
其他好文 时间:
2016-03-30 13:13:26
阅读次数:
320
【摘要】本文分析了Linux内核对于信号的实现机制和应用层 的相关处理。首先介绍了软中断信号的本质及信号的两种不同分类方法尤其是不可靠信号的原理。接着分析了内核对于信号的处理流程包括信号的触发/注册/执行 及注销等。最后介绍了应用层的相关处理,主要包括信号处理函数的安装、信号的发送、屏蔽阻塞等,最后 ...
分类:
系统相关 时间:
2016-03-27 14:04:17
阅读次数:
267