平台:linux(Shell)软件:Weka,SAS,Spss,R,IBM IM,Mathout语言:Java,Python,PHP,MapReduce编程,Ruby数据库:SQL,MySQL算法:数据挖掘算法,机器学习算法,搜索引擎(推荐算法,反作弊,排序)(备注:回归、决策树、SVM、朴素贝叶斯...
分类:
其他好文 时间:
2015-06-05 00:32:27
阅读次数:
168
从决策树学习谈到贝叶斯分类算法、EM、HMM引言 近期在面试中,除了基础 & 算法 & 项目之外,经常被问到或被要求介绍和描写叙述下自己所知道的几种分类或聚类算法(当然,这全然不代表你将来的面试中会遇到此类问题,仅仅是由于我的简历上写了句:熟悉常见的聚类 & 分类算法而已),而我向来恨对...
分类:
编程语言 时间:
2015-06-04 20:59:41
阅读次数:
267
计算数据集的香农熵from math import logdef calcShannonEnt(dataSet): numEntries = len(dataset) labelCounts = {} for featVec in dataset: currentLa...
分类:
其他好文 时间:
2015-06-03 13:30:21
阅读次数:
113
决策树是一种预测模型,它由决策节点,分支和叶节点三个部分组成。决策节点代表一个样本测试,通常代表待分类样本的某个属性,在该属性上的不同测试结果代表一个分支;分支表示某个决策节点的不同取值。每个叶节点代表一种可能的分类结果。
使用训练集对决策树算法进行训练,得到一个决策树模型,利用模型对未知样本(类别未知)的类别判断时,从决策树根节点开始,从上到下搜索,直到沿某分支到达叶节点,叶节点的类别标签就是...
分类:
编程语言 时间:
2015-06-02 23:32:03
阅读次数:
336
The Analytics Edge的中文名称应该叫做《数据分析的极限》,来自MITx。这门课最大的特点就是通过各种应用,介绍机器学习和优化的方法,使用的是统计学专用的语言R,所介绍的方法都是最经典的算法。机器学习中,监督学习的算法介绍了线性回归、逻辑回归、决策树与随机森林,非监督学习的算法介绍了分...
分类:
其他好文 时间:
2015-05-29 23:02:46
阅读次数:
2623
工作任务:了解Jquery运用js判断用户输入是否正常和js的运行原理决策树如何在程序中体现网站在移动端和浏览器端的兼容性显示5.javascript的使用规定与技巧工作心得1.2.3.4.5.Screen对象存储了客户的电脑屏幕信息,这些信息可以用来探测客户端硬件的基本配置Screen对象的基本属..
分类:
其他好文 时间:
2015-05-28 14:23:52
阅读次数:
202
引文:前面提到的K最近邻算法和决策树算法,数据实例最终被明确的划分到某个分类中,下面介绍一种不能完全确定数据实例应该划分到哪个类别,或者说只能给数据实例属于给定分类的概率。基于贝叶斯决策理论的分类方法之朴素贝叶斯
优点:在数据较少的情况下仍然有效,可以处理多类别问题
缺点:对于输入数据的准备方式较为敏感
适用数据类型:标称型数据。
朴素贝叶斯的一般过程
收集数据:可以使用任何方式
准备数据:需要数...
分类:
编程语言 时间:
2015-05-28 14:09:46
阅读次数:
263
工作任务:了解Jquery运用js判断用户输入是否正常和js的运行原理决策树如何在程序中体现网站在移动端和浏览器端的兼容性显示5.dns的工作原理6.css使用规定工作心得1.2.3.4.5.6.css中的点"."代表了类的意思,并不意味着一种从属关系.a{}.b{}在css中,有空格表示一种包含关系,比..
分类:
其他好文 时间:
2015-05-27 01:06:12
阅读次数:
124
SVM1.概述SVM全称Support_Vector_Machine,即支持向量机,是机器学习中的一种监督学习分类算法,一般用于二分类问题。对于线性可分的二分类问题,SVM可以直接求解,对于非线性可分问题,其也可以通过核函数将低维映射到高维空间从而转变为线性可分。对于多分类问题,SVM经过适当的转换,也能加以解决。相对于传统的分类算法如logistic回归,k近邻法,决策树,感知机,高斯判别分析法(...
分类:
其他好文 时间:
2015-05-25 10:12:27
阅读次数:
183