码迷,mamicode.com
首页 >  
搜索关键字:anaconda 数据挖掘 机器学习    ( 12837个结果
数据挖掘十大算法--Apriori算法
一、Apriori 算法概述 Apriori 算法是一种最有影响力的挖掘布尔关联规则的频繁项集的 算法,它是由Rakesh Agrawal 和RamakrishnanSkrikant 提出的。它使用一种称作逐层搜索的迭代方法,k- 项集用于探索(k+1)- 项集。首先,找出频繁 1- 项集的集合。该集合记作L1。L1 用于找频繁2- 项集的集合 L2,而L2 用于找L2,如此下去,直到不能找到 ...
分类:其他好文   时间:2014-05-01 17:50:47    阅读次数:280
【机器学习算法-python实现】svm支持向量机(1)—理论知识介绍
(转载请注明出处:http://blog.csdn.net/buptgshengod) 1.背景        支持向量机SVM(support vector machines)。SVM是一种二值分类器,是近些年比较流行的一种分类算法。 本文,首先要介绍一些基本的知识概念,在下一章将对SVM进行简单地代码实现。 2.基本概念 (1)线性可分...
分类:编程语言   时间:2014-05-01 17:48:01    阅读次数:374
95行代码实现最大熵模型训练
关于最大熵模型的介绍请看:http://www.cnblogs.com/hexinuaa/p/3353479.html 下面是GIS训练算法的python实现,代码不到100行。 from collections import defaultdict import math class MaxEnt(object):     def __ini...
分类:其他好文   时间:2014-04-30 22:46:39    阅读次数:384
MapReduce--Logistic Regression (逻辑回归)
MapReduce--Logistic Regression...
分类:其他好文   时间:2014-04-30 22:37:39    阅读次数:830
机器学习笔记——贝叶斯学习
概率   理解概率最简单的方式就是把它们想像成韦恩图中的元素。首先你有一个包括所有可能输出(例如一个实验的)的全集,现在你对其中的一些子集感兴趣,即一些事件。假设我们在研究癌症,所以我们观察人们看他们是否患有癌症。在研究中,假设我们把所有参与者当成我们的全集,然后对任何一个个体来说都有两种可能的结论,患有或没有癌症。我们可以把我们的全集分成两个事件:事件"患有癌症的人"(表示为A),和"不患...
分类:其他好文   时间:2014-04-30 22:31:39    阅读次数:259
【机器学习算法-python实现】逻辑回归的实现(LogicalRegression)
(转载请注明出处:http://blog.csdn.net/buptgshengod) 1.背景知识       在刚刚结束的天猫大数据s1比赛中,逻辑回归是大家都普遍使用且效果不错的一种算法。   (1)回归                先来说说什么是回归,比如说我们有两类数据,各有50十个点组成,当我门把这些点画出来,会有一条线区分这两组数据,我们拟合出这个曲线(因为很有可能是非...
分类:编程语言   时间:2014-04-30 22:15:39    阅读次数:454
机器学习中的有监督学习,无监督学习,半监督学习
在机器学习(Machine learning)领域,主要有三类不同的学习方法: 监督学习(Supervised learning)、 非监督学习(Unsupervised learning)、 半监督学习(Semi-supervised learning), 监督学习:通过已有的一部分输入数据与输出数据之间的对应关系,生成一个函数,将输入映射到合适的输出,例如分类。 非监督学习:直接...
分类:其他好文   时间:2014-04-30 22:12:38    阅读次数:297
【数据挖掘】分类之Naïve Bayes
1.算法简介 朴素贝叶斯(Naive Bayes)是无监督学习的一种常用算法,易于实现,没有迭代,并有坚实的数学理论(即贝叶斯定理)作为支撑。 本文以拼写检查作为例子,讲解Naive Bayes分类器是如何实现的。对于用户输入的一个单词(words),拼写检查试图推断出最有可能的那个正确单词(correct)。当然,输入的单词有可能本身就是正确的。比如,输入的单词thew,用户...
分类:其他好文   时间:2014-04-29 13:38:20    阅读次数:476
程序员找工作经验
我是2013.04.01左右的时候开始准备找工作的,找工作的时候自己有些迷茫:1.不知道想要从事什么方向的工作;2.不知道要去哪里工作。 于是我在网上搜了很多的面经,另外找了几本书看了下,后来决定了以下几个方向:1.图像、视觉;2.分布式计算或存储;3.机器学习;4.北美求职。 虽然上面列了这么多条,但是这些方向的面试都会有算法面试,所以我首先就开始了算法的练习,在这里我推荐几个不错的网站:1...
分类:其他好文   时间:2014-04-29 13:34:22    阅读次数:274
支持向量机(SVM)非线性数据分割
翻译自OpenCV官网,支持向量机非线性分割原理介绍,仅供学习参考~~...
分类:其他好文   时间:2014-04-29 13:24:22    阅读次数:323
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!