目录:1.关联分析2. Apriori 原理3. 使用 Apriori 算法来发现频繁集4.从频繁集中挖掘关联规则5. 总结1.关联分析 返回目录关联分析是一种在大规模数据集中寻找有趣关系的任务。这种关系表现为两种形式:1.频繁项集(frequency item sets):经常同时出现的一些元素的...
分类:
编程语言 时间:
2015-11-28 21:38:47
阅读次数:
358
原文:http://www.zhihu.com/question/27068705机器学习中的Bias(偏差),Error(误差),和Variance(方差)有什么区别和联系?修改最近在学习机器学习,在学到交叉验证的时候,有一块内容特别的让我困惑,Error可以理解为在测试数据上跑出来的不准确率 ,...
分类:
其他好文 时间:
2015-11-28 13:34:35
阅读次数:
1236
原文:http://www.zhihu.com/question/2070082927 个回答46赞同反对,不会显示你的姓名ALAN Huang,什么都会一点点欣然、王志、马克等人赞同Orangeprince的回答非常学院派,也非常系统。 过拟合表现在训练数据上的误差非常小,而在测试数据上误差反而增...
分类:
其他好文 时间:
2015-11-28 13:25:47
阅读次数:
289
关于数据挖掘方面的研究,我原来也走过一些弯路。其实从数据挖掘的起源可以发现,它并不是一门崭新的科学,而是综合了统计分析、机器学习、人工智能、数据库等诸多方面的研究成果而成,同时与专家系统、知识管理等研究方向不同的是,数据挖掘更侧重于应用的层面。 因此来说,数据挖掘融合了相当多的内容,试图全面了解所有...
分类:
其他好文 时间:
2015-11-28 10:28:33
阅读次数:
137
1、机器学习概论。 2、线性回归与Logistic。案例:电子商务业绩预测 3、岭回归,Lasso,变量选择技术。从一团乱麻中识别有用维度的技巧 4、降维技术。案例:业绩综合指标设计 5、线性分类器,Knn算法,朴素贝叶斯分类器,文本挖掘,案例:智能判断垃圾短信,通过文本挖掘给用户加标签,评论自动分...
分类:
编程语言 时间:
2015-11-26 01:23:58
阅读次数:
240
一.Noise and Probabilistic Target
分类:
其他好文 时间:
2015-11-25 16:40:14
阅读次数:
108
机器学习实战 http://www.cnblogs.com/qwertWZ/p/4582096.html机器学习实战笔记:http://blog.csdn.net/Lu597203933/article/details/37969799#第一个kNN分类器 inX-测试数据 dataSet-样本数....
分类:
其他好文 时间:
2015-11-25 16:37:29
阅读次数:
181
大数据未来几年发展的重点方向,大数据战略已经在十八届五中全会上作为重点战略方向,中国在大数据方面才刚刚起步,但是在美国已经产生了上千亿的市场价值。举个例子,美国通用公司是一个生产飞机发动机的一个公司,这家公司在飞机发动机的每一个零部件上都安装了传感器,这些传感器在飞机发动机运作的同时不断的把发动机状...
分类:
其他好文 时间:
2015-11-25 10:11:34
阅读次数:
210
程序员要站在巨人的肩膀上,C++拥有丰富的开源库,这里包括:标准库、Web应用框架、人工智能、数据库、图片处理、机器学习、日志、代码分析等。标准库C++ Standard Library:是一系列类和函数的集合,使用核心语言编写,也是C++ISO自身标准的一部分。Standard Template ...
分类:
编程语言 时间:
2015-11-25 08:40:24
阅读次数:
310
一.Definition of VC Dimension
分类:
其他好文 时间:
2015-11-24 22:01:54
阅读次数:
197