在介绍朴素贝叶斯分类之前,首先介绍一下大家都比较了解的贝叶斯定理,即已知某条件概率,如何得到两个时间交换后的概率, 也就是在已知P(A|B)的情况下如何求得P(B|A)?可以通过如下公式求得: 而朴素贝叶斯分类是一种简单的分类算法,称其朴素是因为其思想基础的简单性:就文本分类而言,它认为词袋中的两两 ...
分类:
编程语言 时间:
2017-10-15 14:13:28
阅读次数:
233
依据机器学习算法如何学习数据可分为3类:有监督学习:从有标签的数据学习,得到模型参数,对测试数据正确分类;无监督学习:没有标签,计算机自己寻找输入数据可能的模型;强化学习(reinforcement learning):计算机与动态环境交互,学习错误反馈达到更优的目的。 依据机器学习期望结果来分类: ...
分类:
其他好文 时间:
2017-10-13 19:04:33
阅读次数:
171
先收藏。。。。。。。。。。。。 本文为笔者在学习周志华老师的机器学习教材后,写的课后习题的的编程题。之前放在答案的博文中,现在重新进行整理,将需要实现代码的部分单独拿出来,慢慢积累。希望能写一个机器学习算法实现的系列。 本文主要包括: 1、logistics回归 2、python库: numpy m ...
分类:
编程语言 时间:
2017-10-12 10:33:40
阅读次数:
441
前言 谷歌董事长施密特曾说过:虽然谷歌的无人驾驶汽车和机器人受到了许多媒体关注,但是这家公司真正的未来在于机器学习,一种让计算机更聪明、更个性化的技术。 也许我们生活在人类历史上最关键的时期:从使用大型计算机,到个人电脑,再到现在的云计算。关键的不是过去发生了什么,而是将来会有什么发生。 工具和技术 ...
分类:
编程语言 时间:
2017-10-11 16:55:57
阅读次数:
364
1、集成学习概述 1.1 集成学习概述 集成学习在机器学习算法中具有较高的准去率,不足之处就是模型的训练过程可能比较复杂,效率不是很高。目前接触较多的集成学习主要有2种:基于Boosting的和基于Bagging,前者的代表算法有Adaboost、GBDT、XGBOOST、后者的代表算法主要是随机森 ...
分类:
编程语言 时间:
2017-10-10 22:01:01
阅读次数:
242
转自:https://zhuanlan.zhihu.com/p/25765735 在应用机器学习算法时,我们通常采用梯度下降法来对采用的算法进行训练。其实,常用的梯度下降法还具体包含有三种不同的形式,它们也各自有着不同的优缺点。 下面我们以线性回归算法来对三种梯度下降法进行比较。 一般线性回归函数的 ...
分类:
其他好文 时间:
2017-10-10 16:42:00
阅读次数:
174
作者:知乎用户链接:https://www.zhihu.com/question/29187952/answer/48519630 我居然今天才看到这个问题,天……本专业,有幸听过他们这个实验的组会来解(che)答(dan)一下。 之前在陆朝阳组内开组会的时候师兄正好在做这个,我本科是这个专业的,之 ...
分类:
编程语言 时间:
2017-10-10 14:41:28
阅读次数:
211
课程介绍 信用风险评分卡为信用风险管理提供了一种有效的、经验性的解决方法,是消费信贷管理中广泛应用的技术手段。 评分卡是信用风险评估领域常见的建模方法。评分卡并不加单对应于某一种机器学习算法,而是一种通用的建模框架,讲原始数据通过分箱后进行特征工程变换,继而应用于线性模型进行建模的一种方法。 课时列 ...
分类:
其他好文 时间:
2017-10-09 16:49:49
阅读次数:
175
引言 LDA(Latent Dirichlet Allocation)称为潜在狄利克雷分布,是文本语义分析中比较重要的一个模型,同时,LDA模型中使用到了贝叶斯思维的一些知识,这些知识是统计机器学习的基础。为了能够对LDA原理有清晰的认识,也为了能够对贝叶斯思维有全面的了解,在这里对基本知识以及LD ...
分类:
编程语言 时间:
2017-10-08 21:26:05
阅读次数:
246
什么时候适合用机器学习算法? 1.存在某种规则/模式,能够使性能提升,比如准确率; 2.这种规则难以程序化定义,人难以给出准确定义; 3.存在能够反映这种规则的资料。 所以,机器学习就是设计算法A,从包含许多假设的假设集合H里,根据所给的数据集D,选出和实际规则f最为相似的假设g。 注:g和f相似度 ...
分类:
其他好文 时间:
2017-10-07 19:36:54
阅读次数:
177